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PRESENTATION 

Annie Bourret et Marie-Claude VHomme 



Presentation 

Dans le sens de sa nouvelle orientation vers Tamenagement linguistique priorisant les industries 
de la langue (IDLL) et fidele & son travail de pionnier dans le domaine de la linguistique informati- 
que, le CIRB a reuni dans ce recueil une serie de textes, afin de donner un aper$u de h problema- 
tique dans ce domaine, des acquis et des defis qui restent k relever. 



Les industries de la langue constituent un domaine encore peu connu dont le concept, ne 
dans un contexte francophone, a emerge en 1984 et a commence *i dtre diffuse en 1985. L'ensem- 
ble des pays francophones, lors des travaux de la Conference des chefs d'Etat et de Gouvernement 
des pays ayani en commun Tusage du frangais^ ont inscrit les industries de la langue dans 
leur programme de preoccupations majeures. Depuis, le terme industries de la langue a ete vehicule et 
apprdte au goQt des auteurs qui Tont utilise pour faire etat de preoccupations diverses : la langue 
frangaise dans la diffusion des techniques et des sciences, Tinformatique en frangais, la linguistique 
informatique, ... 



Lieu de conjonction de la technologie informatique ainsi que de la recherche et de 
retude systematique des langues, les IDLL designent de fa?on generique une serie d'ap- 
plications informatiques dont la conception ne peut se faire sans apport, a un moment donne, 
de connaissances linguistiques. Les IDLL mettent Tordinateur au service de la linguistique 
mais, de plus, mettent la langue au service de Tordinateur : elles contribuent a la recherche en 
linguistique et offrent des produits informatiques commercialisables. Par ailleurs, les IDLL sont 
apparues comme une solution de sauvegarde de la langue frangaise en tant que langue vehiculaire de 
la science et de la technic .5. En offrant des produits comme des algorithmes d'analyse du langage 
uaturel, des systemes de traduction automatique, la langue fran?aise pourrait se ranger parmi les 
grandes langues diffusantes dont fait partie, evidemment, Tanglais. Les applications des IDLL 
trouvent usage dans des secteurs aussi varies que ceux de Teducation, de la sante, de la gestion et de 
la securite. 



Malgre les uombreux acquis - notamment en terminologie. en traductique et en aide 
^ la redaction - il reste de nombreux problemes, qu'un amenageir**"'. linguistique de Tinformatique 
plus judicieux devrait permettre de resoudre. Nombre d'auteurs soulevent les dif ficultes & obtenir un 
nsateriel decent utilisable en fran?ais. Les IDLL, en plus d'cppartenir k un domaine hautement tech- 
nique, se chargent d'une connotation affective lorsqu'il s'agit des enjeux mdme de la production de 
cette technologie. 



Bats 



^Conf^rence tenue t Paris du 17 au 19 f^vrier 1986. 
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Annie Bourret et Marie-Claude L'Homme 



Plusieurs des textes reunis dans ce recueil ont fait I'objet d'une communication lors 
de h Deuxieme Conference des chefs d'Etat et de Gouvernement des pays ayant en com- 
mun I'usage du franfais^ et temoignent de la volonte des pays francophones de po jrsuwre les travaux 
dans le domaine des IDLL. 

Les textes donnent un apergu general des domaines que regroupent les industries de la langue 
(quoiqu il s'agisse dans la plupart des cas d'applications specifiques). Les IDLL restent encore diffi- 
ciles a circonscrire et malgre lour apparente nouveaute, elles rassemblent des spheres d'activite moins 
recentes. 



Les IDLL englobent : 



1 . le traitement des langues naturelles : I'analyse, la comprehension et la generation automati- 
ques du langage naturel; 

2. le traitement de la parole : reconnaissance et synthase vocales, analyse du signal; 

3. la traduction assistee par ordinateur et la traduction automatique; 

4. la fabrication de produits informatiques : logiciels de langue frangaise; 

5. la terminotique et I'informatique lexicographique : aides aux taches le'xicographiques et 
terminologiqnes , nouveaux medias de diffusion; 

6. les aides a la redaction : traitement de texte avance ou non, editique, correcteurs varies; 

7. la reconnaissance automatique de caracteres; 

8. I'informatique documentaire. 



II n a pas ete possible dans le cadre de cette publication de couvrir I'ensemble des domaines des 
industries de la langue et des axes de recherche de chacun d'entre eux. Mis k part le premier texte 
qui porte sur le theme general des industries de la langue, les textes abordent un aspect particulier 
du domaine. Ceux-ci touchent de I'enseignement assiste par ordinateur (evaluation des didacticiels) du 
traitement automatique de la parole (description d'un logiciel d'application rdgles phonologiques) 
de la traductique, du traitement des langues naturelles (analyse de textes en langue naturelle, correc- 
teur orthographique, lemmatisation), de la terminologie (banques de terminologie, etude sur le voca- 
bulaire); les textes traitent egaiement des limites et des problemes de I'informatique en frangais tant 
sur le plan technique que sur le plan politique ou social (amenagement linguistique en informatiqu'^ 
degre de difficulte des textes relatifs k I'informatique, r61e des organismes d'Etat) 



La conKrence s'est tetme K Qu«b«c les 3 et 4 septembre 1987, la joum^e rtservie aux industries de la langue 
lieu le 5 septembre 1987. 

ERJC 



L'INDUSTRIALISATION DE LA LANGUE FRANCAISE 
ET SON MAINTIEN COMME GRANDE LANGUE VEHICULAIRE 
DE LA SCIENCE ET DE LA TECHNIQUE^ 

Pierre Auger 
Langues et linguistique 
Universite Laval 



On parte beaucoup, ces dernieres annees, de la situation de la langue frangaise comme grande 
langue vehiculaire k Techelle planetaire. Ces bilans, presque toujours negatifs, laissent entendre que le 
frangais est en perte de vitesse et quj la francophonie, telle une peau de chagrin, est en train de 
retrecir dangereusement ses zones d'influence. Les uns biament avant tout une demographie d6cli- 
nante, caracteristique des pays industrialises du Nord, d'autres I'influence dominante de 
Tanglo-americain sur tout le domaine scientifique et technique qui accompagne le pouvoir econo- 
mique. Les plus idealistes s*e:i prennent a I'incurie des gouvernements et des pouvoirs publics et leur 
politique def aitiste du laisser-faire. Enfin, les plus biases veulent bien croire et repandre que Tdpoque 
de gloire du f rangais est pass6e, qu'il faut 6tre de son temps et accepter cette domination linguistique 
comme une condition sine qua non au progres engendre par la modernite. Quoiqu'il en soit, malgre la 
divergence des points de vue, tous sont d'accord pour dire que le fran?ais est en train de vivre la 
pire crise de croissance de sa longue histoire, une saga autodestructrice en qu^.lque sorte. 

Cette question delicate sera apprehendee sous Tangle du cc ^^cept de langue vehiculaire tel que 
defini par le sociolinguiste frangais Louis-Jeaa Calvet, c'est-^-d«e «une langue utilisee pour Tinter- 
communication dans des situations plurilingues» (Calvet 1981:71-91). Dire du frangais qu'il doit de- 
meurer une langue vehiculaire, c'est en quelque sorte affirmer en meme temps qu'il doit continuer 
d'appartenir au groupe tres reduit (select, faudrait-il ecrire) des langues d'intercommunication sur la 
scene internationale qui trans- cendent en quelque sorte la «diff iculte de communiquer» qui est le lot 
des langues ou groupes de langues vues comme trop etrangeres ou exotiques pour servir d'interlingua 
dans les echanges internationaux. Selon Calvet, les facteurs dominants qui amenent une langue k 
jouer ce rdle sont d'ordre geographique, economique, politique, religieux et historique (prestige) 
principalement (Calvet 1981:77-95). Dans cette concurrence que le fran^ais doit vivre avec I'anglais 
americain dans son statut de langue vehiculaire, il faut isoler particuliferement les facteurs economique 
et politique; nous le verrons en profondeur plus loin. Les pays riches sont puissants et possedent des 
langues fortes et inversement. Le poids linguistique de ces langues va d'ailleurs continuer i s'accroi- 
tre au mfime rythme que leui richesse et leur pouvoir. Si Ton applique ce principe au rdle vehiculaire 
que joue une langue dans le domaine de la science et de la technique, il y a fort ^ parier que le pays 
qui produit le volume le plus important d'innovation en ces domaines verra sa langue jouer ce rdle 
presque sans con'^urrence. C'est ce qui est arrive k la langue amdricaine et, sans nul doute, rien ni 
personne ne pourront y changer quoi que ce soit, il faut bien se le dire. 

C'est ainsi que le statut de I'anglo-americain comme langue vehiculaire a continue de se consoli- 
der et de progresser avec le developpement fulgurant de I'informatique durant la decennie actuelle et 
rinformatisation en profondeur de la societe qui a suivi. Les Americains ont ete les premiers et, 
cons6quemment, ils seront sOrement les derniers ^ voir s'atrophier leur espace linguistique interna- 
tional. Cette informatisation, il y a & peine dix ans, limitee essentiellement A certains secteurs re- 



^Communication pr^sentie lor« du 66* Congris de I'ACFAS, Moncton, 9-13 mai 1988. 
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serves des entreprises ou des centres de recherche et dirigee par des gourous informaticiens 
tout-puissants a pris un essor demesure, socialement parlant, avec I'arrivee de la micro-intormatique 
et I'envahissement de toutes les zones de la societe et de la vie dite privee (famille, loisirs, etc.). 
On chercherait en vain un facteur d'implantation linguistique plus puissant que cette informatisatioii 
galopante qui a joue en faveur de I'anglais americain ces dix dernieres annees. II faut vivre desor- 
mpis ayec cette idee qu'ii est illusoire de penser que le frangais pourrait voir renversee k son profjf 
cette situation, tout au plus peut-il aspirer h conserver une deuxieme place si I'incurie ne gagne paj 
ses locuteurs, qu'Iis soient politiciens, chercheurs, .specialistcs, industriels ou simples usagers. Le 
chercheur Richard Parent, familier de ces questions, fait un bilan bien realiste de la situation lorsqu'il 
ecrit : «I1 est done important, en considerant le marche francophone de reconnaltre le fait de la 
domination de I'anglais par I'ampleur et I'excellence de la recherche developpement qui se fait dans 
cette langue. Du point de vue des usagers francophones de I'informatique, une version bien traduite 
et adaptee, ou facile h adapter au frangais est une necessite. Mais il y a des differences culturelles, 
linguistiques, sociales, liees aux organisations qui necessitent des adaptations plus delicates devant 
s'appuyer sur la recherche ergonomique, anthropologique, psychologique, linguistique, etc.» (Parent 
1986:4). C'est dans cette voie que nous poursuivrons notre expos6 et que nous tenterons de demon- 
trer que si la cause est entendue, tout espoir n'est pas perdu pour I'expansion de la langue frangaise 
dans le domame crucial de I'informatique moderne. Un defi important est a notre portee et, en tant 
que francophones, nous devrons le relever. 

Ce defi ne doit pas se definir comme une lutte h I'anglo-americain comme nous venons de le 
voir. II s'agit moins de lutter contre un envahisseur potentiel ou reel, mais de preserver sa place 
dans ce tres petit club des societes ayant la chance de parler une langue qui est en mSme temps une 
langue vehiculaire de transmission du savoir sur le olan international. Cela ne devrait rien enlever a 
I importance de vouloir relever le defi. Un autre phenomene vient ajouter tout son poids h cette 
question et m, le frangais est solidaire des autres grandes langues du inonde. En effet, I'informati- 
sation profonde que la plupart des Etats modernes vivent a des retombees culturelles negatives qu: ne 
sont pas a negliger. Nous savons tous le rdle dominant que joue encore I'ecrit dans nos societes et 
facteur nouveau, ce sont les ordinateurs qui gerent la plus grande part de la masse des ecrits que 
produisent nos societes. Cette gestion massive de I'ecrit par I'informatique n'a en fait rien d'anodin 
pour les langues traitees, et li, le frangais rejoint le lot des autres grandes langues modernes des 
pays industrialises utilisant une informatique d'abord congue pour I'anglais : - logiciels de traitement 
de texte supportant difficiler-ent les caracteristiques graphiques des langues nationales, - claviers mal 
adaptes, - logiciels de correction deficients, - documentation traduite, etc. L'ancien ministre frangais 
de la Culture Jack Lang faisait une intervention qui allait dans ce sens, en novembre 1986, au CoIIo- 
que de Tours : «L'incapacite d'un automate h gerer les particularismes linguistiques (par exemple, les 
accentuations en franvais, les ecritures non latines) influe gravement sur le media et done r,ur le 
contenu. L';ncapacit6 ie ce mSme automate h realiser pour une langue ce qu'il peut faire pour une 
autre (par exemple, une aide i la correction orthographique ou a la redaction) met la premiere en 
situation d'Stre supplantee par la seconde, siniplement parce qu'i! sera moins coQteux de produire dans 
une langue pour laquelle on disposera des machines les plus performantes» (Lang 1986:17-18). Cette 
situation decrite par M. Lang evoque bien I'en jeu culturel qui accompagne I'actuelle mutation techno- 
logique pour les peuples. C'est un peu dans les mSmes termes que le Frangais Bernard Cassen decri- 
vait la portee de ce'. eujeu lors du mdme colloque : «Mais cet enjeu, et il est pourtant de taille, est 
en passe d'etre supplante par un autre, decisif celui-m : certains des outils les plus puissants de la 
recherche - les ordinateurs - sont de nature h destabiliser completement notre langue, en la mettant 
hors jeu dans la communication homme-machine, puis dans I'ensemble de la communication ecrite, 
deji presque totalement tributaire de I'ordinateur, et en generant des produits qui, graduellement, 
envahiront I'univers quotidien du simple citoyen» (Cassen 1 986: J 3). A moyen et a long terme, ce sont 
done les langues capables d'Stre traitees par les orumateurs et de converser avec ces derniers qui 
domineront le marche de I'ecrit entendu da . son sens economique, culturel et linguistique. Au 
rythme oil vont les choses peu d'entre elles seront encore au rendez-vous en I'an 2000. 

"L^i induetries de la langue. Enjeux pour !'Europ<", Tours, 28 f^vrier - l**" mar« 1986. 

o 1(. 
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II est important ici d'ouvrir une parenthese pour introduire un concept nouveau qui a fait son 
apparition i partir de 1985 a peu pres et qui connait une carriere florissante depuis lors : les «Indus- 
tries de la langue». Une presentation de ce concept relativement nouveau et son application au 
developpeiaent du frangais va situer le debat qui nous occupe aujourd'hui vers une perspective beau- 
coup plus large qui nous fera depasser la simple question «Faut-iI franciser rinformatique?» pour en 
poser une nouvelle, plus decisive «Peut-on se passer de Tinformatique en frangais pour survivre en 
tant que francophones?» On parle de plus en plus ces dernieres annees de ce concept nouveau en 
linguistique appliquee. Les «Industries de la Iangue» sont ^ rattacher directement i tout le domaine 
de rinformatique d'orientation (extuelle. C) concept a et6 defini lors du Premier sommet de la 
francophonie de Paris^ de la fagon suivante «[Les *.idustries de la langue sont celles qui] fabriquent 
et commercialisent des automates qui manipulent interpretent, generent le langage humain, aussi bien 
sous sa forn^e ecrite que sous sa forme parlee» {Rapport de synthese : Industries de la langue 
1986:86). De fagon plus precise, on peut encore definir les industries de la langue comme «des acti- 
vites de developpement, de production et de commercialisation des nouvelles technologies de Tin- 
formation (NTI) qui font appel a la fois a Tinformatique (ordinateurs et logiciels) et aux resultats de 
Tetude systematicjue des langues. Elles developpent des produits (machines) capables de trailer des 
informations linguistiques et susceptibles de communiquer ces informations entre eux et egalement 
avec les humains» {Rapport de synthese : Industries de la langue 1986:86). Une definition plus prag- 
matique nous est donnee par William Baranes dans la revue Qui-vlve international lorsquMl ecrit que 
«(0r) cette manipulation «machinique» necessite des produits industriels. On assiste done d, la nais- 
sance de veritables «industries de }a Iangue», regroupant d'une part les artisanats traditionnels du 
langage (traduction, dictionnaires, et:.) qui s'industrialisent gr^ice aux moyens informatiques, et, sous 
la poussee de la dcmande, d'autre part, un ensemble d'acti vites nouvelles, au confluent de rinformati- 
que et de la linguistique (traitement automatique du langage naturel, s>nthese et reconnaissance de la 
parole, etc.) (Baranes 1986:74). 

Ces produits issus des industries de la langue peuvsnt efre classes en trols grandes categories 
{Rapport du Sous-comite des Industries de la langue au Comite de coordination des contributions 
quibecoises 1987) : 



a) Les outils de d^veloppement de la langue 

U s*agit essentiellement d'outils internes de recherche et de developpement qui sont mis a h 
disposition des linguistes, des terminologues et des traducteurs, et qui sont necessaires t la moderni 
sation de la langue et k sa necessaire adaptation t revolution technologlque. On peut classer dan^ 
cette categorie les travaux de recherche linguistique qui comprennent tous l<*s Instruments physiques, 
conceptuels (algorithmes) ou les logiciels utiles aux red erches terminologiques, linguistiques et se- 
mantiques: analyse de texte, reconnaissance de termes complexes, indexation, modelisationde proces- 
sus, etc. On peut rattacher k ce groupe les reseaux de termlnologie et les banques de donnees 
linguistiques et terminologiques qui sont d'ores et deja des outils i^cs performants d'acces a Tinfor- 
mation de type linguistique. 



b) Les outils d'utilisation de !a conhaissance lingulstiqMe 

On situe dans cette categorie les outils qui permettf.nt de traduire dans des applications de la 
vie courante les resultats dc la zecherche dans les differentes spheres de rinformatique linguistique. 
Les systemes de traduction automatique sont a classer dans cette seconde categorie. lis constituent 



^Conftrence des chefs d'Etat et de Gouvemement des pays ayant en commun I'usage du franvats* Pans, 1^ 19 
ftvrier 1986. 
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un des domaines les plus anciens de la recherche en inteIHgeni-e ardflcielle et ce n'est que mainte- 
nant, tout juste anres trente ans de recherche, que Ton commence k obtenir des resullats interessants 
daa^ ce domaine. On peut encore citer, dans la mfime cate&orie, les banques de donnees textuelles, les 
systemes d'interpr6tation du langage naturel, les systemes de contrdle vocal pour les machines, les 
systimes experL et les didacticiels. 



c) Les outils de realisation de produits llnguistlques 

La quasi totalite des textes produits aujourd'hui transitent, a un moment donne de leur existen- 
ce, par un ordinateur. C'est done dire I'importapce que prend aujourd'hui I'informJ^lique h orientation 
textuelle. Pour une langue comme le frangais, ce fait est louJd de consequences. En effet comment 
concevoir I avenjr du frangais comme langue vehiculaire dans un environnement informatique presque 
exc usivement domine par la langue anglaise? La langue de «travail» des ordinateurs est presque 
exclusivement I'anglais et les logiciels sont le plus souvent congus en fonction de I'anglais (ex pro- 
blemes des claviers, classement des unites linguistiques par les s.g.b.d/ sans prise en 
compte des signes diacritiques du frangais, absence de reconnaissance des structures syntaxiques du 
fran9a.^s, etc.). I! va sans dire que I'avenir du frangais comme langue vehiculaire de la science et de 
la technique esi aussi he au developpemen, ^e ces outils orientes vers le texie. Parmi ces produits 
qui visent la realisation de produits linguistiques ou langcsgiers (le te.ite, sous toutes s-s formes), 
mentionrions les logiciels de traitement de texte, les progiciels grammaticaux ou les correcteurs ortho- 
graphiques, les logiciels d'editique, les logiciels d'indexation ou de generation de textes, les diction- 
nairts et les thesaurus sur disque compact (CD-ROM) pour ne mentionner que les produits les plus 
cjurants. On peut done voir 1'impj.rtance des IDLL^ comme domaine de recherche dans le monde 
contemporain, domaine carre'our pour tout le progres concernant les sciences de I'information Lors 
du colloque de Tours«, Bemarct Cassen, un des precurseurs visionnaires en ce domaine, affirmait avec 
force que «(0n peut mficie dire) que les langues qui ne .Vindustrialiseront pas cesseront, i un tftrme 
Plusou moins bref, d'5'tre vehicu'aires, parfois mftme dans d'impo- tants secteurs d'activite des pays ou 
elles sont parlees» (Cassen 1986:13). Plus recemment, le linguiste Claude Hagege ecrivait dans le 
meme sens : «Une attention toute particuliere doit egalement Stre accordee k ce que Ton appelle les 
industries de la langue, c'est-i-dire I'application industrielle du tmitement de la langue, en tant que 
materiau par les machines informatiques, afin de repondre k un certiun nombre de basoins de secteurs 
tels que 1 Education, la sant6, la s6curite, etc. Si le fran^ais ne s'Industrialise pas, ses chances de se 
maintenir au niveau d'une langue Internationale iront en s'amenuisant, ac fait de la pression crois- 
sante qu'exerceront, dans tout type de communication industrie'le, commerciale et scientifique les 
ordinateurs capables de manipuler I'anglais, c'est-i-dire la langue des ingenieurs qui coi-s- 
truisent actuellement le plus d'crdinateurs» (Hagege 1987:249). C'est k la mSme conclusion 
quarrivent les chefs d'Etat des pays francophones reunis k Quebec au mois de septembre 
1987 ; on peut lire, en effet, dans les documents de conference publics lors du Sommet 
de Quebec que : «La langue frangaise doit s'inscrire rapidement dans le mouvement actuel 
d industrialisation des langues, autrement elle deviendra de moins en moins apte au de- 
veloppL^ment de la recherche et de la production dans les secteurs de pointe et, k long terme, se 
marginahsera par rapport aux autres g/andes langues de communicafion Internationales dans ces 
champs dactivite essentiels k I'avenir de la francophonie» {Documenis de conference 1987:173). II 

'^S.ff.b.d. — tytXtiC* de geation <le buet de donnjes. 

^IDLL est un acronyme pour Industries de la langue. 

L«< indujtries de la langue. Enjeiix pour I'Europe^. Tc jw. 28 Kvrier - l**" man 1986. 

^Deuxi^me Conttrencc des chefs d'fitat et de Gouvememert des pays a/ant en commun Pusage du francais, Quebec, 
septembre 1987. 
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faut noter que sous ces discours, leurs auteurs laissent entendre que les efforts actuels des pays 
francophones pour industrialiser la langue frangaise ne sont pas suff isants et qu'il > aurait urgence de 
remedier a cette situation. 

Dans le cadre de la cooperation franco-quebecoise et de la preparation de la future structure des 
Sommets francophones, les gouvernements frangais et quebecois mettaient sur pied en 1985 un groupe 
de travail bilateral dit «Groupe de reflexion et d'action sur les enjeux de la francophonie (Harvey de 
Saint- Robert))). Les resultats contenus dans le rapport du Groupe de travail identifiaient clairement 
des besoins de developpement de Tinformatique en langue frangaise (domaine que Ton recouvrira 
bientdt sous le generique «industries de la langue))). Ce premier constat d'un groupe francophone 
identifiait prioritairement «rurgence de la creatio" ?n langue frangaise de logiciels originaux et de 
Tadaptation de cette meme langue aux produits existants. Un espace cultural et economique franco- 
phone, souhaite par plusieurs, ne pourra^videmment pas se constituer sans qu'un effort concerte et 
important ne soit consenti a I'edification dans nos pays d'une Jidustrie du logiciel, fer de lance 
efficace et novateur de Tavenement de la societe de demain, celle oe Tinformation et des communica- 
tions)) (Actes de la Conference 1986:45). Dans cette foulee, le Groupe identifiait des besoins priori- 
taires quant a la diffusion de Tinformation sur le stock de logiciels disponibles en langue frangaise et 
4 la conception, la production et la distribution des logiciels en langue frangaise. Pour ce deuxieme 
aspect, le Groupe de travail identifiait plusieurs elements touchant Tindustrie du logiciel en langue 
frangaise, comme I'utilisation dans le commerce et Tindustrie de logiciels en langue frangaise pour 
accompagner le choix du frangais comme langue de\du travail, Tadaptation de logiciels originellement 
en langue anglaise pour le benefice de tous les francophones (cooperations multilaterales), formation 
des atilisateurs, des concepteurs de logiciels, des technicians elaboration de didacticiels qu' 3nt un 
poids linguistique important et developpement d'une terminologie informatique en langue frangaise 
unifiee en concertation avec toutes les regions de la francophonie. Le meme Groupe proposait en 
guise de conclusion un train de mesures touchant quatre volets principaux (Actes de la Conference 
1986:44-45) : 

1- constitution d'une banque de donnees sur les logiciels disponibles en langue frangaise, 

2- misc sur pied de programmes de formation et de cooperation avec TACCT touchant J'infor- 
matique en langue frangaise; 

3- elaboration d'un dictionnaire encyclopedique de I'i: " -nnatique en langue frangaise et enf in, 

4- e*'\blissement de structures favorisant des entente^ c ^ nmerciales et industrielles multilate- 
rales entre producteurs de logiciels. 

Nous verrons que ces orientations se sont modifiees quelque peu dans les annees suivantes avec 

Discns enfin que le Groupe remettait aux gouvernements des Etats francophones des responbabnltes 
importantes d'animation, de financement et de contrdle de I'espace infurmatique francophone. 

Vers la meme epoque, un autre grouse de travail, Canada- Quebec cette fois, a ete mis sur pied 
par les ministeres des communications canadien et quf becois pour etudier la question du developpe- 
ment du logiciel d'expression frangaise. Dans le rapport qu'il a ndu public en 1986 touchant cette 
question, le Comite decrit dans le detail les caracteristiques du marche quebecois du logiciel, les 
contraintes de I'industrie evoluant sur le continent amerjc^in. les besoins de francisation qui s'expri- 
ment au niveau du travail et du commerce et enfin, le rdle que devrait jouer TEtat en ce domaine 
(Rapport d'etape du Ccmte Canada-Quebec 1986). Fait interessant, le Comite a recueilli plusieurs 
elements sur les caracteristiques (tendanc s) linguistiques des usagers industriels quebecois (apprehen- 
sions, choix dustandard linguistique, acceptabilite langagiere etc.). Voici quelques-uns des problemes 
releves dans le rapport du Comite et relies k la francisation informatique : 

i- ies iogicieis en frangais ne representent pas un standard (ils ne functionnent pas avec 
loutes les imprimantes, ils necessitent des ajustements parfois tres hborieux sur les cla- 
viers, etc.); 
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2- les logiciels americains les plus courants semblent g^ner t un degre moindre les utilisateurs 
francophones dans la mesure ou ils font appel t un vocabulaire limite de nature mnemo- 
nique; 

3- la langue constitue una variable particulierement importante pour certains types de logi- 
ciels comme le traitement de texte, la comptabilite et les produits destines i un usage 
domestique; 

4- les logiciels (ainsi que la documentation) con?us en France sculevent parfois des incom- 
p/ehensions quant a la terminologie utilisee et des incompatibilites quant aux pratiques 
intormatiques; 

5- les acheteurs craignent que la version frangaise des produits de langue anglaise ne soit 
pas la plus recente, ou que les versions evoluees du produit ne soient plus disponibles en 
frangais. 

Les resultats obtenus par le Comite mixte Canada-Quebec mcttent ici evidence la necessite 
d'une approche tres adaptee a la situation economico-linguistique du Quebec et de 1* Amerique, dif f ici- 
lement conciliate, peut-dtre, avec Tapproche globalisante et panfrancophone suggeree dans les tra- 
vaux des Sommets francophones depuis 1986. Pour Tindustrie en general, le fait d*appartenir a une 
Amerique majoritairement anglophone impose des contraintes dont il faut tenir compte dans un con- 
texte de francisation informatique. Malgre les arguments demontrant que la disponibilite de logiciels 
en langue frangaise n'est pas toujours une realite, que les coats de francisation sont trop eleves pour 
Tacces a un marche aussi etroit, le Comite a retenu une penurie reelle de logiciels en langue fran- 
9aise dans un certain nombre de domaines cles comme les logiciels comptables, les tableurs et les 
base, le donnees. La situation est encore plus critique dans les domaines pointus des sciences, du 
genie et des systemes experts. Le Comite note encore que : «La demande s*oriente de plus en plus 
vers les produits normalises et valides (progiciels), parametres (offrant la flexibilite necessaire pour 
adapter certaines caracteristiques, la langue d*affichage par exemple, aux besoins de Tusager) et 
«conviviaux» (user-friendly)» (Rapport d'etape du Comite Canada-Quebec 1986). 

Quant i la traduction, le Comite note qu*elle doit s*effectuer en respectant la culture du milieu 
auquel elle est destinee: « ... il importe, lors de la traduction d'un logiciel en d'autres langues, de 
s*adjoindre des traductions qui ont un lien direct avec la culture actuelle du pays auquel est destine 
le logiciel, et d3 preference avec une communaut6 nationale familiere avec la sphere d'activite dans 
laquelle s'inscrit le logiciel.» (Rapport d'elape du Comite Canada -Quebec 1986). II est egalement 
suggere qu'une attention particuliere soit portee au choix de la terminologie apparaissant dans les 
menus de logiciels et dans les documents les accompagnant : « ... La terminologie utilisee, tant dans 
ia conception d*un logiciel que dans sa traduction ou son adaptation pour un pays, doit refleter une 
langue Internationale. Les traductions de documentation americaine effectuees parallelement ici et en 
^urcpo cnt dvj» iSit naitrc dcs ncclogisiucs auA ucua cnuiuits qui risqueni de creer des Divergences 
d'habitudes, difficiles a corriger, qui nuisent a la communication internationale.» (Rapport d'etape du 
Comite Canada-Quebec, 1986). Quant k la terminologie utilisee dans les logiciels produits en France, 
le Comite note: «Les logiciels (ainsi que la documentation) con?us en France soulevent parfois des 
incomprehensions quant k la terminologie utilisee et des incompatibilites quant aux pratiques inf orma- 
tiques» (Rapport d'etape du Comite Canada-Quebec 1986). Nous discuterons plus loin cette assertion. 

Conscient de la situation hautement complexe ou se situe Tinformatique et son utilisation au 
Quebec, TOffice de la langue frangaise reunissait un colloque a Tautomne 1986^. Cet evenement 
organise conjointement par TOf f ice et la Federation de Tinformatique du Quebec visait ^ demontrer la 
disponibilite de la technologie informatique en fran?ais au Quebec et la rentabilite economique et 
sociale qui allait en decouler rapidement. Les conferenciers invites ont mis en evidence un certain 
nombre de faits «strategiques» concernant Tindustrie quebecoise de Tinformatique et son develop- 
pement concurrentiel face au marche. L 3 president de TOffice d'alors, M. Claude Aubin, aff irmait t 
cette occasion que : «La democratisation de Tinformatique entrainant une diminution des coats, Tac- 
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cessibilite accrue aux logiciels ainsi que la convivialite que ceux-ci ont atteint, constituent des assises 
fermes reposant sur les acquis propres ^ la communaute fiancophone. II faut se souvenir qu'en tant 
queconsommateurs francophones de Tinformatique, nous constituons une clientele qui a des droits a 
faire valoir en tant que collectivite attachee k sa lanpue» {Francisation en marche 1986). 

II n*en demeure pas moins que malgre ces propos qui se veulent rassurants un certain nombre de 
problemes sont demeures sans solution ou partiellement solutionnes. M. Conrad Ouellon, organisateur 
de ce CoUoque qui nous reuuit au jourd'hui, dans une conference qu'il a donnee k Quebec ce printemps 
sur rinformatique en frangais, identifiait trois zones grises qui causent le plus de problemes ^ Tutili- 
sateur quebecois (Ouellon 1986:9-11): 

1- le materiel avec i^s claviers diversement francises mais toujours d'utilisation malaisee 
(manipulation des signes diacritiques du frangais, touches identif iees en anglais, etc.) et des 
imprimantes reticentes k reproduire esthetiquement certaines particularites du frangais 
comme les majuscules accentu^es, materiel qu'il faudra, de toute fagon, veiller i configurer 
peniblement et parfois meme en vain. La situation est pire encore avec les lecteurs 
optiques utilises pour le texte; 

2- les logiciels, le plus souvent en anglais ou traduits, mais ne reconnaissant guere le fran- 
gais quand il s*agit d*effectuer des tris ou certaines operations (cf. le traitement que 
reserve DBASE III+ au «e» lorsqu'on ajoute des dossiers a un fichier *.dbf et son incapacity 
4 indexer des mots accentues sans artifice). II en est de meme en general des analyseurs de 
texte, des lemmatiseurs, des logiciels d'indexation et de reconnaissance de texte congus 
d*abord pour Panglais; 

3- les manuels souvent mal traduits ou incomprehensibles meme quand ils sont congus origi- 
nellement en frangais: multiplicite des synonymes, utilisation de termes ambigus ou non 
detinis et caiques, auxquels problemes s'ajoute Tabsence d'une terminologie informatique 
unifiee ou Internationale, nous reviendrons plus tard sur ce point. 

Le conferencier off rait k cette occasion des solutions a court et k moyen termes comme Telabo- 
ration sur une base Internationale de «standards adaptes» au traitement des autres langues que Tan- 
glals pour les problemes de materiel, la conception de logiciels modulaires multilingues permettant une 
melUeure integration Ilngulstlque des prodults Informatiques pour eviter les hiatus culturels am.enes 
par la simple traduction des logiciels et rnfin, la redaction de manuels d'utilisation en une langue 
Claire et comprehensible pour Tusager, ce qui n'est pas un objectif simple a atteindre, nous le verrons 
(Ouellon 1986:13). 

Le Quebec n'est pas le t^txxl Etat francophone a vivre des probiemes de convivialite avec rinfor- 
matique telle qu'Implantee par les Amerlcalns k Techelle planetaire, les francophones europeens, en 
partlculler, dolvent vivre des problemes analogues k ceux qu*a mentionnes M. Ouellon. Si Ton se 
deplace cette fols vers le developpe^aent Informatique en langue frangalse, les problemes « super ficiels» 
que nous venons d*evoquer paralssent bien tenus k c6te de ceux rencontres dans la recherche infor- 
matique 3lle-m§m&, rutlllsatlon des nouveaux langages de programmation orientes vers la langue 
naturelle, le developpementde rintelllgence artlflclelle, la reconnaissance vocale etc. Richard Parent 
pose la question de fagon reallste quand II ecrit : «Va-t-on eriger les nouvelles structures de repre- 
sentation symbollque en langue anglalse k cause du loglciel de developpement qu'on utilise? Les 
consequences epIstemoioglqucS nc soiii-elles pas trcp grandcs? Alicncra t or. .a creativite et !a 
productlvlte conceptuelle des usagers non-mglophones? Plus on attendra, plus le retard sur la langue 
anglalse sera difficile k rattraper k cause de la synergie qui s'etabllt k partir des quelques outils de 
base (syntaxe, lex*-,ues). Cest le temps d*aglr alors que commencent a se deflnir les composantes du 
marche concernant les applications de Tanalyse Ilngulstlque (au sens large) dans la panoplie des outlls 
informatiques qui seront utilises dans les bureaux, les services au public et les resldences.» (Parent 
1986:5). Cest dans le m§me sens que plusieurs conferenciers sont Irtervenus lors Ju Cohoque de 
Tours en 1986, dont Jean-Frangols Degremont, qui a ete avec Bernard Cassen un d^s pre.nlers a 
definir le concept d'Industrles de la Ian/ ue : «I1 est claIr que revolution ainsi amorcee va dans le 
sens d'une automatisation plus poussee de la manipulation des ecrits (correction orthographique. 
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generation automatique, analyse pour resumes, assistance h la traduction) et des sons (synthese de la 
parole incluant la prosodie, et reconnaissance de la parole continue multiloculeurs). Cette evolution 
passe necessairement par la prise en compte des connaissan.:es accumulses par les ecrits.» (Degremont 
1986:23). 

Cest dans le couple linguistique-infcrmatique que se i^ituent les indus-.ries la lapgue 
generatrices des developpements les plus marquants de rinfoiiiiatiaue en 1988. Voici ce -^ue dit 
Jean-Frangois Degremon. % ce sujet : ^<Ainsi, l;:.guistiQue et informatique ont ete conduites a se 
rejoindre en une «informatique linguistique», egalement appelee «automatiqae linguistique» ou 
encore «linguistiquecomputationnelle», visantacomprendre et representer le fonctlonnement du parle 
et de I'ecrit humain, afin d'eii permettre Tinterpretation et la generation par des automates ... Les 
industries de la langue sont celles qui fabriquent Tensemble des produits derives des 
resultatsde la recherche en informatique lingaistique.» (Degremont 1986:25). Le linguiste Andre 
Abbou, directeur-adjoint du V 5seau des industries ie la iangue, en donne une definition plus synthe- 
tique dans son ouvrage recent :,jr le • industries de la langue (Les applications industrielles du traite- 
ment de la langue par les machines) : «Nous designerons ici par industries de la langue tous les 
produits, techniques, actMtes ou services qui appellent un traitement automatique de la langue 
naturelle.» (Abbou 1987:30). 

Cest done avant tout dans le domaine des industries de la langue que doit porter Teffort du 
frangais et c'est cette industrialisation qui lui permettra de demeurer encore une grande langue 
vehiculaire en Pan 2000. Andre Abbou ecrit k ce sujet : «La communaute francophone, si elle veut 
maintenir k la langue frangaise un usage dans les outils technolinguistiques, devra prendre en charge 
les coQts de traitement et d'insertion de sa langue dans de tels outils.» (Abbou 1987:22). Ncus ver- 
rons quel rdle TEtat devrait jouer en ce domaine de Tindustrialisation du frangais. 

A. Abbou identifie dix p61es ^ ce qu'il appelle le «complex^ des industries de la langue» (Abbou 
1987:50) : 

1- la communication parlee (reconnaissance et synthese de la parole); 

2- la traduction assistee par ordinateur ou la traduction de type automatique; 

3- les interfaces en langage naturel; 

4- le traitement de I'ecriture imprimee et manuscrite; 

5- Tassistance a Tanalyse, a la comprehension et k la generation des textes; 

6- le traitement de texte avance; 

7- les nouveaux medias pour I'edition et Tedition de logiciels; 

8- rinformatique documentaire, 

9- Tedition electronique et la publication assiste.ft par ordinateur, 

10- et en surplomb a ces poles, les dominant tous et en illustrant certains, le domaine de TLA. 
(Intelligence artificielle) s'impose comme une dimension majeure du complexe en question. 

De fa?on concrete la maitrise en langue nationale de ces dix aspects constltutifs des Industries 
de la langue equivaui pour un Etat ^ dominer Tinformatlque de demain et particlper au progres et au 
modernisme planetaire. L'atteinte d'un tel objectif passe uicessairement par Torganisatlon de la 
recherche en informatique langagiere selon quatre axes principaux (Abbou 1987:39) : 

a) la recherche relative aux technologies de Tinformation et a rinformatique, destinees a 
Tanalyse automatique du langage naturel dans sa dimension logicielle et materielle; 

b) la recherche en traitement du signal et en electronique pour la communication parlee, 

c) la recherche en sciences du langage pour le traitement de Tecrit et le traitement de Toral 
(genie linguistique); 

d) la recherche autour des «sciences cognitives» et de Tintelligence artificielle pour Tanalyse 
et la synthese des mecanismes de connalsance, et notamment la comprehension du langage 
naturel. 
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Des 1985, d!^ns le cadre des travaux preparatoires du premier Sommet francophone (fevrier de la 
mSme annee), certains esprits precurseurs, dont Bernard Cassen, precisaient certains ni ;eaux d'actions 
juges prioritaires (Actes de la Conference 1986:87) : «Developper, au sein de la Communaute franco- 
phone, les industries de la langue, c'est agir principalement k trois niveaux : 

1- la formation des ingenieurs et chercheurs capables de developper et d'industrialiser les 
automates de manipulation du langage; 

2- la recherche appliquee et Taction des pouvoirs publics ... Cest k ce niveau que sont pro- 
duits les souches sur lesquelles reposer».t les developpements industriels, banques de mots, de 
regies de grammaire, de sons; 

3- le devcloppement pre-industriel de produito integrant des capacites linguiitiques dans tous 
les secieurs d'activites.». 

Le facteui linguistique est mk au premier plan dan? la realisation de cette entreprise, comme on 
peut le lire dans les Actes du Sommet de Paris: «Ainsi done, le facteur linguistique, en lui-meme 
mineur, est erige en substrat et en v^cteur de la production et de Tusage des donnees de toutec 
sortes. Derriere rr.pparenc<j anodine du fait linguistique se profile done soit la capacite d'une nation 
ou d'un groupe dc nations h creer et k produire des biens industriels conditionnant Tensemble de 
leurs activites, soit un statut de simple consommateur, dans la langue de Tautre, de produits strate- 
giques.» {Actes de ia Conference 1986:86). 

Cesti la suir^ des reflexions continues menees depuis 1980 et pilotees par certains Etats fran- 
cophones, comme la France et le Quebec, deji bien impliques dans la recherche en «genie Unguis- 
tique» et aux representations des groupes de recherches oeuvrant en ce domaine, que la structure des 
Somniets francophones nee en 19£6 constituait un Reseau des ind .stries de la langue pour la promo- 
tion des interSts de la langue f rangaise en ce domaine et affirmait par 1^ la volonte des Chefs d'Etat 
francophones d'en faire une priorite. Anime par la France, ce Reseau reunit regiili^rement depuis 1986 
des responsables et des experts nationaux francophones de plusieurs Etats representes au Sommet pour 
preparer des propositions i Tintention des Chefs d'Etats reunis lors des Sommets. L'antenne quebe- 
coise Ce ce Reseau, constitute par le Sous-comite quebecois des industries de la langue a joue et joue 
toujours le r61e de rassembleur et d'animaceur pour *3 Sommet de projets susceptibles de developper 
5es industries de la langue a Techelle de la aancophonie. Cest ainsi qu'i la suite du premier Sommet 
de Paris, le Sous-comite quebecois se nettait au travail pour preparer pour le Sommet de Quebec 
(septembre 1987) des propositions plus precipes touchant les industries de la langue. Une proposition 
ccntenant trois programmes majeurs a ete claburee par le Comite et avalisee par le Reseau {Rapport 
du sous-comite des IDLL 1 987). Le premier touche la recherche et le developpement industriel dans 
les domaines de la communication parlee, du traitement de Tecrit ei de Tintelligence artificielle 
(financement multilateral de 15 millions (NF), financement national de certains projets), proposition 
assortie de la creation d'un Observatoire des evolutions technologiques, des innovations et des mar- 
ches lies aux industries de la langue et d'un Forum des industries de la langue. Le second programme 
est celui de la Creation d'un Reseau international de neologie et de terminologie pour faciliter Tadap- 
tation de la langue frangaise au modernisme technologique. Le troisieme, enfin, est oriente vers la 
formation et le perfectionnemrnt de chercheurs et de praticiens dans le domaine des industries de la 
langue. Ce troisieme programme met Taccent sur le developpement d'un axe Nord-Sud s'inscrivant 
dans une demarche globale «industrialisante» pour que «la langue fran?aise devienne egalement une 
langue rela servant au transfert des connaissances scientifiques et techniques et que, de cette fagon, 
les autres langues de Taire francophone atteignent progressivement un niveau de performance propre ^ 
satisfaire les besoins des pays du Sud.» {Rapport du sous-comite des IDLL 1987). Ces propositions 
adoptees durant le Sommet de Quebec devraient fitre appuyees financierement par un fonds multila- 
teral de quelque 25 millions (NF) et Tengagement des chefs d'Etat k favoriser la recherche en ce 
domaine dans leurs Etats respeclifs. 

Dans les faits, on attend encore depuis le premier Sommet de Paris et celui de Quebec en 1987 
des realisations concretes en ce domaine. D'une part les financements prevus sont cunstamment revus 
k la baisse par voie diplomatique (run attend la mise de Tautre) et rarement degages dans ce cadre. 
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D'autre part, I'organisation des Sommets (Comite du suivi) est daxantage preoccupee par la prepara- 
tion du prochain Sommet (Dakar en ce moment) en favorisant des petits projets «visibles» et peu 
coQteux qui alimenteront cet evenement, ignorant par \t la necessite d'asseoir les programmes pris en 
charge par les Sommets sur des bases permanentes moins fluctuantes selon les politiques du moment. 
On peut toutefois esperer que dans les prochaines annees, des realisations notoires a ce titre pourront 
etre conduites ea aplanissant les obstacles de concurrence economique entre les Etats (les industries 
de la langue sont generatrices de revenus et developperont encore davantage dans les prochaines 
annees cet aspect - il ne faut pas Toublier). 

Une chose est certaine, une organisation panfrancophone de la recherche dans le domaine des 
industries de la langue est devenue necessaire pour assurer I'avenir du fran?ais; une organisation 
nationale est un prereauis a une telle demarche et est done tout aussi essentielle. II convient de 
souligner la necessite du developpement developpement d'une terminologie fran?aise de Tiniormatique 
qui soit fonctionnelle et qui favorise par le fait mdme le dialogue entre experts et les echanges 
intemationaux en langue fran?aise. Enfin, il faudra aplanir un autre obstacle materialise par la, 
variation linguistique du frangais et faire en sorte que les machines puissent maitriser cette variation 
en respectant les varietes de frangais telles qu'elles se pratiquent dans les diverses regions de la 
francophonie. A ces conditions, le frangais a toutes ies chances de demeurer une grande langue 
vehiculaire capable de transmettre les savoirs modernes et d'assurer a ses usagers la possiblite de 
tirer profit du fait d'dtre et de demeurer francophone. 
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L'£VALUATION DES DIDACTICIELS: 
ETAT ET NATURf DE LA DOCUMENTATION^ 

France H.-Lemonnier et Marie-Josee Fortin^ 
Langues et linguistique 
University Laval 



Ce travail s'inscrit dans le cadre d'un projet intitule «Evaluation, analyse et elaboration d'un 
didacticiel de langue»^ lui-meme faisant partie d'un projet plus vaste, le projet RELAI^. II constitue 
en quelque sorte un resultat preliminaire du premier volet de notre recherche^. 

Le domaine de revaluation, applique ^ I'enseignement / apprentissage par ordinateur (EAO), est 
piutut jeune puisque la documentation presentee dans !e cadre de cette etude z ete publiee entre 19'^ 5 
et 1988, 

Par ailleurs, il pent paraitre inhabituel de s'interesser a un tel sujet, ^ savoir la presentation de 
Tetat et de la nature d'uue documentation donnee. Mais si Ton tient compte, d'une part, de la 
nouveaute du domaine des EAO autant pour les didacticiens que pour les linguistes et, d'autre part, 
du nombre restreint et coflteux des didacticiels actuellement disponibles sur le marche, ce travail 
pourrait en interesser plus d'un, notamment ceux qui oeuvrent dans le domaine des EAO a titre 
d'utilisateurs ou de futurs concepteurs, tout en ayant une connaissance restreinte du domaine de 
revaluation. 

L'objectif de cette etude sera done de proposer une classification generale de ces ouvrages et 
d'exposer quelques facettes de leur contenu. Nous presenterons successivement les carac- 
teristiques des 35 instruments d'evaluation repertories (I), celles des 93 articles ou monographies 
(II), et de fagon tres breve, celles d'une centaine de catalogues de promotion de didacticiels (III). 

Nous tenterons de faire ressortir les traits dominants et distinctifs de ces trois repertoires, en 
apportant quelques points de vue critiques. 



Communication pr^sentie Ion du 56^ Congris de I'ACFAS, Moncton, 9-13 mai 1988. 

Nous tenons h remercier Madame Ren&te Moisan pour s& precieuse collaboration h toutes les stapes de ce projet . 
constitution des repertoires, analyse des documents, hypotheses de classincati&n et revision du contenu de cette 
communication. 

o 

Le projet <(£^valuation, analyse et elaboration de didacticiels^ con?.^orte trois volets. Le premier vise ^ faire 
une synthase des ouvrages portant sur I'iv&luation des didacticiels. Le second & trait & la description d^tailUe 
des caracteristiques du didacticiel «iddrl» pour I'enseignement et I'apprentissage du fran^ais langue seconde ou 
itrangire. ht troisiime sera consacr^ & T^Iaboration d'un prototype immddiatement suivi de son experimentation. 
Le premier volet a pu etre TitAitt gr&ce & une subvention accord^e par le projet RELAL 

^L« projet RELAI (Rechet^'... en linguistique appliqu^e t I'informatique) s'inscnt dans le cadre d'une entente entre 
I'Universite Laval et la Society IBM. 

^Voir 4(Lcs donndcs de revaluation des didacticiels . essai de synthase et prospectives pour TEAO langues», rapport 
de rechercheredige paries co-responsables du projet, Mmes France H.-Lemonnier et Renate Moisan. 
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1. Caract6ristiq«2s de 35 Ie struments d*6vaIuation des EAO^ 

Nous avons choisi de presenter les caracteristiques de ces instruments selon deux points de vue. 
Le premier, classification generale des instruments (1.1.), se consacre exclusivement i la description 
externe de ces documents, i savoir les objectifs d'evaluation, la clientele visee par ces instruments, le 
contexte de travail de leurs auteurs et enfin s'ils sont con?us pour evaluer une matiere specifique. 

Le second, contenu general des instruments (1.2.), permet plutdt de faire une description interne 
et de degager le type de questionnement propose, en fonction cependant d'un seul parametre, Torien- 
tation des auteurs de ces instruments. 



1.1. Classification generale des instruments 

La classification generale de ces 35 instruments repose essentiellement sur quatre criteres- 
robjectif d'evaluation (1. 1.1.), la clientele visee (1.1.2.), le contexte de travail de leurs auteurs (1.1.3.) 
et la matiere specifique k evaluer (1.1.4.). 



1.1.1. L'obj?ctif d'evaluation 

Ces 35 instruments peuvent d'abord se distinguer par I'objectif d'evaluation, que Owston (1986) 
quahfie de formelle ou d'informelle. Ainsi, I'utiUcation d'un instrument d'evaluation formelle se fait 
selon une procedure rigoureuse qui conduit k la recommandation ou k la non-recommandation du 
didacticiel examine. 

Par ailleurs, un instrument d'evaluation informelle ne peut dtre utilise qu'a des fins personnelles 
et sa procedure d'utilisation est moins structuree. 

Parmi les 35 instruments examines, six seulement conduisent k une evaluation formelle. 



1.1.2. La clientele visee 

Ces instruments s'adressent praicipalement et parfois simultanement h trois clientele^:, 
lis sont. d'abord destines ^ I'evaluateur, c'est-i-dire celui qui est charge d'observer ou 
d'evaluer un produit. lis peuvent egalement dtre destines i des concepteurs et a des utilisateurs, 
enseignants ou non. 

Cependant, les auteurs de ces differents instruments ont souvent donne une interpretation plus 
large au terme «evaluateur». Pour certains, I'e valuateur peut dtre un directeur d'institution, un 
enseignant ou toute personne responsable du dossier «selection et achat de didacticiels» ou un c'va- 
luateur au sens strict. C'est pourquoi un instrument a pu etre con?u avec plus d'un objectif, dont 
celui d'aider le concepteur k verifier certaines etapes de Telaboration d'un produit, tout en permet- 
tant k des enseignants, producteurs, distributeurs, utilisateurs, d'evaluer un didacticiel. 



1.1.3. Le contexte de travail des auteurs 

Les auteurs de ces instruments sont essentiellement de quatre types. Douze d'entre eux sont des 
universitairec,, c'est-i-dire dts professeurs-chercheurs attaches k differents etablissements universi- 



Ltt rtfgrences de ces 35 instruments n'apparaissenfc pas dans le present texte. Elles seront par ailleurs compI*t< 
dans le rapport de recherche relatif au premier volet de ce pro jet (voir note pr^c^dente). 
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taires. Douze, egalement, travaillent pour un organisme gouvernemental, soit dans des ministeres de 
TEducation de differentes provinces du Canada ou de differents Etats americains. Huit oeuvrent 
plutdt i titre de chercheurs affilies k differents organismes, tels le National Council of Teachers of 
Mathematics, Flnstitut d'^tudes p^dagogiques de TOntario, MicroSIFT, Epie, NEA, etc. Les trois 
deruiers proviennent d'organismes commerciaux. 



1.1.4. La maliere specif ique a e valuer 



Un seul instrument a ete specifiquement congu pour eva'uer des didacticiels Je mathematiques. 
Cinq visent revaluation de didacticiels de langues, langue maternelle ou langue secoude ou etrangere. 
Pour les 29 autres, les auteuis *i'ont pas mentionne si Tinstrument etait congu pour evaluer un didac- 
ticiel visant Tenseignement d'une matiere donnee. 



Cette classification generale permet de constater que les instruments d'evaluation des EAO 
peuvect etre utilises i plus d'une fin et par des clienteles differentes, quelle que soit la matiere 
enseignee. Toutefois, un nombre relai ment restreint d'instruments permet de porter reellement un 



1.2. Contenu general des instruments 



Uexamen plus detaille du contenu de ces instruments permet de degager que Tobservation et 
revaluation d'un didacticiel donne doii se faireen deux moments, Tun pouvant avoir lieu sans vision- 
ner le produit, Tautre Texigeant. 

II est par ailleurs possible d'idenufier trois types de questionnement. Le premier s'adresse plutdt 
k la documentation du produit ^ examiner (1.2.1.), le second t la performance generale du produit 
(1.2.2.) et le troisieme, a la performance du produit en regard des utilisateurs (1.2.3.). 



Chaque questionnement peut conduire ^ un Jugement plus ou moins ^lafoore. 



1.2.1. Le questionnement de la documentation 



Le questionnement de la documentation permet d'obtenir trois types d'informations sur 
le didacticiel examine, soit des informations tris genirales^ telles le titre, Tauteur, Tannee de 
publication, le prix, le producteur, la matiere enseignee, le type de didacticiel et la clientele visee, 
soit des informations d*ordre technique, notamment le mcdele et la marque du micro-ordinateur sur 
lequel fonctionne le aidacticiel, la memoire requise, la disponibilite de copies de secours, le type de 
fonctionnement k savoir sur disque ou sur rcseau, le langage de programmation utilise, le support a 
i'irtiplantation s'il s*agit d'un produit plus complexe, le type de materiel et de logiciel requis pour son 
utilition maximale. II permet enfin d'obtenir des informations plus specifiques sur le contenu, sur le 
modele pedagogique retenu et sur les objectifs du didacticiel. 



En somme, le questionnement de la documentation permet a revamateur de juger si la descrip- 
tion generale du didacticiel est plus ou moins conforme k Tattente d'un consommateur eventuel. 
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1.2.2. Le questionnement de la performance du didacticiel 

Le questionnement de la performance cherche isavoir si le produit fonctionne bien, s'll contient 
ce qu on a prealablement decrit. Pour evaluer cet aspect, I'evaluateur doit visionner le didacticiel et 
tenter de repondre h des questioui portant sur le contenu, les objectifs, I'intergt pedagogique la 
pertinence d'utiliser I'ordinateur pour enseigner cette matiere. 

Les questions sont con?ues pour permettre de juger si le contenu presente est exact, s'il con- 
vient au niveau suggere, s'il est conforme au programme scolaire, s'il est exempt d'erreurs et si les 
objectifs enonces sont atteints. 

Par ailleurs, certaines questions permettent de mesurer la performance informatique proprement 
dite, k savoir la facilite du branchement, la fiabilite, la souplesse, I'eff icacite des structures d'aide la 
retroaction, de mfime que ses qualites techniques (couleurs, son, graphisme, deroulement des affi- 
chages, des pages-ecran, etc.). 

Ce type de questionnement est sans aucun doute le pJus exigeant. 11 recouvre les aspects les plus 
importants de revaluation d'un enseignement/apprentissage par ordinateur, soit le contenu, les objec- 
tifs, ie niveau, I'lnterSt pedagogique et la performance informatique proprement dite. II rejoint en 
quelque sorte les preoccupations premieres de tout enseignant. 



1.2.3. Le questionnement de la performance du produit en regard des utilisateurs 

Le questionnement de la performance du produit en regard des utilisateurs contient un certain 
nombre de questions permettant de juger si le didacticiel est oriente vers I'utilisateur selon les 
points de vue de I'enseignant et de I'apprenant. 

On cherche entre autres k savoir si I'enseignant doit intervenir auprfes de I'apprenant si I'inte- 
r6t des apprenants est maintenu et si ces derniers contrdlent facilement le deroulement du I'ogiciel et 
enfin si I'age et le niveau suggeres par les producteurs convient bien ax utilisateurs observes. ' 

Autrement dit, ce type de questionnement permet de mesurer si I'interdt de i'app-f?nant est 
soutenu, si le contenu convient bien h I'dge et au niveau suggeres et si i'utilisateur a une certaine 
facihte a contrdler le deroulement technique du didacticiel. 

D'autre part, aucun de ces questionnement ne permet de mesurer I'efficacite d'un apprentissage 
fait au moyen d'un didacticiel donne en regard d'un autre moyen. II ne permet pas non plus de 
mesurer I'efficacite de I'utilisation de I'ordinateur pour I'enseignement/apprentissage d'une matiere 
donnee, en I'occurrence I'enseignement/apprentissage des langues. 

II permet tout au plus de se faire une idee generale des qualites minimales de base que devrait 
posseder un didacticiel. 



IL Caract6ristiques de 93 articles et nionographies portant sur revaluation des EAO 

Dans I'ensemble de la litterature portant sur revaluation de didacticiels. une place importante est 
egalement accordee aux instruments d'evaluation. En effet, ceux-ci sont souvent analyses ou criti- 
ques, toujours dans le but d'ameliorer le processus d'evaluation, pour ainsi assurer une meilleure 
investigation de la qualite des didacticiels. Les ouvrages s'interessant aux instruments d'evaluation ne 
constituent cependant qu'une des cinq categories selon lesquelles il est possible de les classifier. 
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Nous presenterons cette partie de notre documentation selon les points de vue adoptes lors de 
la presentation des instruments (I). Le premier, classification generale (2.1.)- se consacre k leur 
description externe, t savoir leur type, leur provenance et le contexte de travail de leurs auteurs. 
Le second, contenu general (2.2.), s'attache A leur description interne et permet de degager quel- 
ques facettes de ces ecrits. 



2.1 Classification generale des articles et monographies 

Les ouvrages sont en majorlte tir6s de periodiques ^ caractere educatif, issus pour la plupart de 
differentes associations. lis provienncnt des Etats-Unis, du Quebec et de TOntario; il y en a tr^s peu 
de TEurope. 

Les auteurs sont generalement des chercheurs affilies ^ des universites, ou rattaches a des 
organismes gouvernementaux et commerciaux. Notons enfin que parmi Tensemble de ces ouvrages, 
seulement six s'interessent aux langues de fagon specifique. 

En somme, comme pour d'autres domaines, les monographies se font plus rares que les arti- 
cles, et comme on pouvait s'y attendre, les Etats-Unis sont en tdte de liste en ce qui a trait au 
nombre d'fiv :ts. ll est egalement interessant de constater que le contexte de travail des auteurs 
de Ces ecrits est le mfitne, qu'ils s'agissent d'artic t de monographies ou d'instruments. Enfin, 
le domaine de I'enseignement des langues proprement Jit n'a guere occupe de place d'un point de 
vue quantitatif, puisqu'on n'a denombre que douze ecrits, soit six articles et six instruments. 



2.2 Contenu general des articles, documents et communications 

Le contenu general des articles, documents et communications s'est avere plus difficile i cir- 
conscrire que celui des instruments, compte tenu de ia prise en compte d'elements aussi varies que 
des rcodeles d'evaluation, des modeles de dictdCticiels, des strategies d'apprentissage, des criteres de 
quali^-^, des procedures a adopter pour cerner les criteres d'un bon didacticiel, des projets d'eva- 
luation, des theories d*enseignement/apprentissage dont il serait souhaitable de tenir compte, etc. 
M^lgrd !^ diversite de ces points de vue et nour le^ hftsoins de cette etude, nous presentons, sous 
toutes reserves, une premiere classification en cinq categories. La premiere concerne les positions 
prises en regard de la quality des didacticiels (2.2.1.), I^ seconde, les apprcches u'evaiuatlcn formative 
(2.2.2.), !a troisieme, les positions prises en regard des instruments d'evaluation (2.2.3.), Ia quatrieme, 
les opinions et les comn:.entaires generaux (2.2.4.) et la cinquieme, Thistorique de revaluation (2.2.S.). 



Une qu^rantaine d'articles traitent des criteres de qualite inherente ou souhaitee ^ tout bon 
didacticiel, selon differentes perspectives dont le^ unes s'attachent S des aspects plus specifiques. 

Ainsi, certains auteurs (Cruickshand et Telfer 1980 et Bell 1985) s'interessent & revaluation de 
didacticiels en fonction du type d'interaction (jeux et simulation, tutoriel, exerciseur, etc.) ou da type 
d*exercices (exercices de discrimination, application de regies, solution de problemes, etc.). 

D*autres (McCan 1981 et Rashio et Lange 1984) prdnent Tutilisation de strategies d*appren- 
tissage telles le contrdle du programme par Tapprenant Tamenant ^ de frequentes prises de decisions, 
ou encore, pour ceux qui ont besoin d'unc aiac exterieure, le ttavail a deux ou trois sur le mdme 
terminal. 



2.2.1. La qualite des didacticiels 





20 



France H.-Lemonnier et Marie-Josee Forlin 



p'autres encore mentionnert la trop grande i-^nortance accordee par certains auteurs aux carac- 
teristiques techniques ou i la qua!:!e du dldacticiel et proposent des criteres plus varies (Budoff, 
Thofmana et Gras 1985). Mulier (1985), pcur sa part, prcsente un ensemble de criteres pouvant etre 
utilises i titre experimental dans des recherches en evaluation de didacticiels. 

p*autres suggerent des strategies permettant de rcsoudre les desaccords relatifs aux criteres d un 
bon didacticiel (Roblyer 1 98 1 ), ou des methodes systematiques pour evaluer des didacticiels (Sakamoto 
et autres, 1979) ou des procedures permettant d'extraire des criteres utiles (Jack 1983). 

II existe par ailleurs des perspectives plus globales, et plus englobar.tes, comme Tapproche de 
Della-Piana (19S2), mettant en parallele la critique de film et revaluation de didacticiels ou celle de 
Roblyer (198 1) qui introduit le concept de «standards», donnant lieu i un ensemble de criteres repar- 
tis en trois categories: caracteristiques essentielles, caracteristiques esthetiques ^^jt caracteristiques 
propres i fa matiere enseignee, Blum-Cohen (1983) et Nesbit (1984) vont dans le mSme sens et 
soulignent le besoin de determiner ce ^I'est un bon didacticiel. D'autres auteurs (Wade 1980; Wager 
1981 et Steffin 1983) poussent plus loin le besoin d'etablir des caracteristiques propres k la matiere 
enseignee en prdnant la prise en compte d'une «theorie de basex, prenant appui sur les principes 
d'apprentissage de Gagne et Briggs (1979). Compte tenu que chaque matiere enseignee requiere des 
conditions d'apprentissage differentes, une analyse prealable de^ apprenants et des concepts ^ ensei- 
gner permettra en effet de determiner les princinejs ftssentiels k un apprcntissagc cfficace. 



2.2.2. Les approches d'evaluation 

Sous cette categorie, f ^gurent vingt-deux articles traitant de revaluation formative et/ou somma- 
tive, distinction etablie par Scriven (1967). L*evaluation formative est affectu6e durant le develop- 
pement d*un p^ jduit et avant sa mise en marche, et revaluation sommative, lorsque le produit est 
complete. 

^ La plupart des auteurs ayant ecrit sur le sujet (Truett 1984; Golas 1983 et Avner 1975) relatent 
la difficulte d'utiliser une prccddure d'evaluation formative en tenant compte de ses \eritables fins, 
quel que soit le iiiateriel didactique k evaluer. Seuls Brown et Ellinger (1978) presentent une proce-^ 
dure d'evaluation fjrmative etsommative de didacticiels. L'etude de McMillan (1981) traite de reva- 
luation de materiel ecrit. 



2.2.3. Les instruments 

Les articles regroupes sous cette categorie constituent une presentation sous forme d*anal>sc ou 
de revue critique de certains instruments d'evaluation. Certains ont fail des etudes comparatives ou 
des syntheses (St- Laurent 1984; Ashmore 1984 et Wager 1981, etc.) 

D'autres (Miller et Burnett 1984; Jonhston 1987, etc.) font des mises en garde relatives aux 
contextes de leur utilisation. Enfin, Rr .hio et Lange (1984) soulignent le besoin d'elaborer des Ins- 
truments d'evaluation pour chaque discipline, en particulier pour les didacticiels de langues. 



2.2.4. Les opinions et commentaires 

Sans fondement particulier et sans argumentation tres elaboree, certains auteurs, dans de courts 
articles, presentent des considerations d'ordre general, souvent subjectives. lis donnenl parfoi^ des 
conseils judicicux ou font des predictions qui amenent i la reflexion. 
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2.2.5. L'historique de revaluation 



Les principales methodologies ou ap^ jches pour revaluation de didacticiels sont bien digage'^s, 
et selcn Tordre chronologique, dans les articles de Borich et Jemelka ('981) ct Johnston (1987). Dans 
la m4me perspective, Dudley-Marling et Owston (1987) s'interessent^ revaluation en rt .rd de diffe- 
rents criteres sur laquelle elle est basee. 

Cctte presentation tr6s sommaire du contenu g6n6ral cette partie de la documentation des 
EAO permet de constater la grande variete des themei abordds et des perspectives envisagies. Tou- 
tefois, le besoin de ddfinir ce qu'est un bon didacticiel et le besoin de s'appuyer sur une theorie de 
base ressortent nettement, que ce soit \x>ut elaborer un didacticiel ou une procedure d*evaluation de 
didacticiels. 



IIL Caract^ristiques d'une centaine de catalogues de promotion de didact!^iels 

Des 273 lettres envoyees dans le but de nous procurer des catalOi.*ues de promotion de didacti- 
ciels, 13! sont dem<*urees sans reponse, ce qui s'explique par les nombrcux changements d'adresse des 
maisons d^edition et aussi par ia disparition de piusieurs d'enire eiies. 

Nonobstant ces faits, nous avons reussi i obtenir 194 catalogues provenant principalement des 
Etats-Unis et du Canada, quelque-uns de la France. Cependant, nous avons den^mbre seulement 84 
catalogues qui faisaient la promotion de 99 didacticiels de langues. 

L'un des objectifs de cette recherche etait de realiser une liste de didacticiels de frangais 
langue seconde pour etudiants non-francophones en milieu universitaire. 

Par ailleurs, il a 6te tres difficile d*arr4ter notre choix sur ccs 99 didacticiels, puisqtie les 
desc.'""tions qui en sont faites dans les catalogues ont un caractere plus commercial que pedagogique. 
Elles s*adressent au grand public, et sont souvent peu ou pas representatives, aussi bien du contenu 
que de la d rnarche p6dagogique. 

Les rdsultats presentes dans le cadre cette 6tude ne concernent toutefois que le public et 
le niveau, puir-^re ceux-ci sont les premie criteres & considerer lors de Tachat de tels produits. 
Or, selon ces deux criteres, il s'avJre que, p;,nni ces 99 didacticiels* 34 sont congus pour des etu- 
diants, soit de niveaux collegia! (6), debv tants, intermddiaires, avances (10), de la 1" secondaire au 
coll6g!al (6)y de la ^ secondaire i Puniversite (7), de la 4* secondaire i Tuniversite (1) ou ^ncore 
pour des etudiants de tous niveaux (4). 

Pour 14 d*entre eux, aucun niveau n*est mentionne, ih peuvent ainsi s'adresser i des adolescents, 
i des adultes ou i tous les Sges. Les 51 suivants ne s'adressent pas i un public specif ique et de- 
vraient convenir k tous les niveaux, debutants, intermediaires ou avancds. 

Ainsi, sur un total de 99 didacticiels, 30 sont destines k une certaine clientele de niveaux varies. 

Ces resultats amdnent i constater quMl est difficile, voire mdme impossible, de selectionner des 
didacticiels k partir de telles descriptions. L*effet de promotion des catalogues est alors ccnsidera- 
blement diminue. Leur seul avantage reside dans le fait de nous faire connaitre Texistence de titres 
et de maisons de distribution. Pour connaitre un peu mieux ce type de produits, il faut alors i'en 
procurer, sans savoir s'ils repondent it nos besoins, vu Timpossibilite de les visionner. 

Le manque de transparence des descriptions nuit sans aucun doute k la prQmo4ion de ce t>pe de 
produits et par consequent, aux concepteurs-producteu^* De plus, le fait que piusieurs didacticiels 
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puissent convenir t plusieurs clienteles, du secondaire i I'universite, k titre de debutants en langue, 
intermediaires ou avances, laisse un peu perplexe si Ton prend en compte notamment le seul critere 
de la motivation. 



Synthase et conclusion 



Les instruments d'cvaluation proposent des questionnements suf fisamment elabores pour fournir 
des cnteres de choix i un utilisateur, ou pour informer un furur concepteur des dimensions dont il 
devrait tenir compte, lors de I'elaboration d'un didacticiel. Cependant, les questions recouvrent des 
champs tellement generaux qu'il est possible de faire revaluation de didacticiels de mathematiques et 
de didacticiels de langues avec un meme instrument. 

Les articles, documents et communications portant sur revaluation des didacticiels permettent de 
mieux circonscrire la variete des perspectives prises en compte par ce domaine. Une analyse sommaire 
du contenu de cette documentation permet en ef fet de degager certaines priorites, soit t regard de la 
classification des nombreux criteres proposes dans les instruments, soit t I'egard du besoin de s'ap- 
puyer sur des theories lors de la conception de modeles. 

Les catalogues nous font connaitre quantite de titres, de maisons d'edition et de prix. 

Cette documentation pourra en outre dtre utile aux enseignants. D'une part, elle leur permettra 
de se famihariser avec les concepts vehicules dans revaluation de didacticiels. D'autre part, elle leur 
permettra de developper une certaine vigilance lors de visionnements de didacticiels. 

De plus, d'un certain point de vue, cette documentation est trop elaboree pour ce que sont par 
exemple certains didacticiels examines, la plupart etant des programmes courts et recouvrant seule- 
ment un aspect d'une matiere dcnnee. D'autre part, elle est trop restreinte puisqu'elle permet dif fi- 
cilenient de mesurer des aspects importants, notamment la pertinence et I'ef ficacite de rutilisation de 
I'ordinateur pour I'enseignement/apprentissage d'une matiere donnee. 

Par ailleurs, il est possible de degager de cette documentation certains aspects «theoriques» 
caracterisant un didacticiel de quality, - en depit du fait que I'enseignement/apprentissage varie en 
fonction du type d'etudiants et de leurs besoins, de la sorte de contenu et des objectifs specifiques 
du materiel. 



Ces aspects seraient les suivants : 



1 - Un bon didacticiel repose sur I'elaboration d'un «design» general et de differents «designs» 
specifiques tels celui du contenu h enseigner, celui des activites d'apprentissage, celui des 
tests, celui de la presentation, celui de la performance technique, etc. 

2' Lors de I'elaboration de tels «designs», I'equipe de concepteurs s'est appuyee sur des theo- 
ries, quel que soit le design k elaborer. 

3- Un bon didacitciel a ete soumis i une procedure d'cvaluation formative (pendant son de- 
veloppement) et sommative (avant sa mise en marche definitive). 

Cependant, avant d'entreprendre I'elaboration d'un didacticiel de frangais langue seconde, des- 
tine 4 des etudiants non-francophones en milieu universitaire (ce qui constitue I'un des volets de 
notre projet), des reflexions prealables s'imposent, relativement i la pertinence et a la rentabilite 
d'un tel projet. 



ERIC 



2/ 



L'fiVALUATION DES DIDACTICIELS... 



Supposons que Tanalyse de la pertinence s*avere positive, on peut en outre se demander si 
le coOt d'investissement en vaudrait la peine compte tenu qu*un tel enseignement necessite Tachat 
de plusieurs postes d'ordinateur. Pourrait-on rentabiliser un tel investissement au point de vue 
economique, etant donne que les universites ne sont pas regies par des programmes uniformes? 

II nous semble quMl faudrait pouvoir repondre i de telles questions, et i bien d'autres, avant de 
se lancer dans un projet d'elaboration de didacticiels. La prise en compte des elements de la docu- 
mentation presentee dans le cadre de cette etude constituerait sans doute un sage point de depart. 



24 



France H.-Lemonnier et Marie-Josee Fortin 



BIBLIOGRAPHIE 



ERIC 



ASHMORE, T.M. (1984). "Evaluating CAI Material for the Microcomputer^ Paper presented at the 
Annual Meeting of the Speech Communication Association, Chicago, [ERIC ED-252180]. 

AVNER, R.A.(I975). "The Evolutionary Development cf CAI Evaluation Approaches^ Paper pre- 
sented at the Annual Meeting of the American Eduvational Research Association, Washington. 
D.C [ERIC ED-105897]. 

BELL, M.E. (1985). "The Role of Instructional Theories in the Eval' ation of Microcomputei Course- 
wa^e^ In Educational Technology, 25 (3), 36-40. 

BLUM-COHEN, V.L. (1983). "Criteria for the Evaluation of Microcomputer Courseware". In Educa- 
tional Technology, 23 (1), 9-14. 

BORlCH,G.D.etR.P. JEMELKA (1981). "Evaluation". In Computer-Based Instruction: A Siaie-of- 
the- Art Assessment, edited by Harold F. O'Neil Jr., New- York: Academic Press, chap. 6,161 -209. 

BROWN, B.R. et R.S. ELLINGER (1978). "Evaluation of Computer-Based Instructional Material: 
Intent and Procedures." In ACM TOPICS in Instructional Computing, A Special Publication of 
SIGCUE, 22-23. 

BUDOFF, M., THORMANN, J. et A. GRAS (1 985). "Evaluating and Seclecting Software". In Micro- 
computer in Special Education, Cambridge / Massachusetts: Brookline Books, 129-139. 

CRUICKSHAND, D.R., et R. TELFER (1980). "Classroom games and simulations". In Theory into 
Practice, 19 (1), 75-80. 

DELLA-PIANA, G.M. (1982). "Film Criticism and Micro-Computer Courseware Evaluation". In New 
Directions for Program Evaluation: Field Assesments of Innovative Evaluation Methods, edited by 
N.L. Smith, San Francisco: Jossey-Bass Publishers, 11-28. 

DUDLEY-MARLING, C. et R.D. OWSTON (1987). "The State of Educational Software: A Criterion- 
Based Evaluation". In Educational Technology, 27 (3), 25-29. 

GAGNE, R.M. et L.J. BRIGGS (1979). In Principles of Instructional Design^ New York: Holt, 
Rinehart, and Winston. 

GOLAS, K.C. (1983). "The Formative Evaluation of Computer- Assisted Instruction". In Educational 
Technology, 23 (1), 26-28. 

JACK, C.S. (1983). "Effective Evaluation of Software for Resale". In The DES Professional, Profes- 
sional Press Inc., 2 (6), 112, 114, 170. 

JONHSTON, V.M. (1 987). "The Evaluation of Microcomputer Programs, an Area of Debate". In Jour- 
nal of Computer-Assisted Learning, 3 (1), 40-50. 

MCCAN, P.H. (1981). "Learning Strategies and Computer-Bnased Instruction". In Computers and 
Education, 5 (2), 133-140. 

MCMILLAN, R. A. (1981). "Formative Evaluation of Textbooks". In Evaluation News, 2 (4), 343-349. 



L'£VALUATION DES DIDACTICIELS... 



25 



MILLER, L. et J.D. BURNETT (1986). "Theoretical Considerations in Selecting Language Arts Soft- 
ware." In Computers and Education, 10 (1), 159-165. 

MULLER, E.W. (1985). "Application of Experimental and Quasi-experimental research Designs to 
Educational Software Evaluation". In Educational Technology, 25 (10), 2'/ -31. 

NESBIT, I.S. (1984). "Evaluating Micro Software". In Datamation, 30 (11), 74-78. 

OWSTON, P..D. (1986). Software Evaluation. A Criterion-Based Approach, Toronto: York University 
Press, 8i p. 

RASHIO, R. et D.L. LANGE (1984). "A Discussion of the Attributes, Role, and Uses of CAT Materials 
in Foreign Languages". In Journal of Computer-Based Instruction, 11 (1), 22-27. 

ROBLYER, M.D. (1981). "When is it "Good Courseware?" Problems in Developing Standards for 
Micro-computer Courseware". In Educational Technology, 21 (10), 47-54. 

SAINT-LAURENT, L. (1984). devaluation de didacticiels: document provisoire,Ste-For. INKS- 
Education, [EDUQ-8570679]. 

SAKAMOTO, T., KIMURA, K., SKIMADA, M., OZAWA, S., and T. OK AMOTO( 1979). "Eva- 
luation Methods for Improving CAL Materials". In Computers and Education, 3 (4), 281-291. 

SCRIVEN, M. (1967). "The Methodology of Evaluation". In R.W. Tyler, R.M. Gagne, and Scriven, M. 
(Eds). Perspectives of Curriculum Evaluation, Chicago: Rand McNally. 

STEFFIN, S.A. (1983). "A Suggested Model for Establishing the Validity of Computer- Assisted Ins- 
tructional Materials". In Educational Technology, 23 (1), 20-22. 

TRUETT, C. (1984). "Field Testing Eductional Software: Are Publishers Making the Effort?". In 
Educational Technology, 24 (5), 7-12. 

WADE, T.E. Jr. (1980). "Evaluating Computer Programs and Other Teaching Units". In Educational 
Technology, 20 (11), 32-35. 

WAGER, W. (1981). "Issues in the Evaluation of Instructional Computing Programs". In Educational 
Computer Magazine, 1 (3), 20-22. 



ERLC 



6\i 



PHONO: 

UN APPLICATEUR DE RfeGLES PHONOLOGIQUES 
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I Introduction 

Ce pi ■>jet a vu le jour dans le cadre d*un seminaire d*automatisation linguistique que nous avons 
donne & Tuniversite Laval i, Tautomne 1987. II avait pour but d*initier les etudiants qui y assistaient 
& certaines notions d*algorithmique et de programmation en linguistique et plus particulierement en 
phonologie et en phonetique. 

Le projet a ensuite pris plus d'ampleur quand nous avons decide de tenter de modeliser une 
partie des connaissances que les phonologues, les phoneticiens et les sociolinguistes avaient accumu- 
lees depuis un certain nombre d'annees. 



II Plan de I'expos6 

L*expose portera sur les points suivants : d*abord, une explication des objectifs poursuivis dans 
le cadre de cette recherche et de la structure generale du programme tel qu'il existe et f onctionne en 
ce moment. Puis la discussion portera sur la creation des caracteres phonetiq aes a Tecran, la carac- 
terisation ou la specification du systeme phonologique et du contexte extra-linguistique, Talgorithme 
de syllabation et les regies phonologiques qui ont, jusqu*^ maintenant, ete implantees. Enfin, les 
developpements ^ venir, c*est-4-dire les ajouts et les ameliorations & ce programme seront rapidement 
abordes. 



m Objectif 

PHONO est un programme qui cherche a modSliser partiellement le comportement de locuteurs 
typiques d'une ou de plaaleurs varietes linguistiques parlees au Quebec. Cette modelisation 
linguistic (ue est toutefois limitee aux niveaux phonologique et phonetique du systeme linguistique. 
Concretoment PHONO, k partir d*une representation phonologique donnee et d'un contexte 
extra-lii^guistique defini par Tusager, g6nere la representation phonetique probable correspondante. 

Ceci amene quelques remarques : 

a) II faut insister sur le fait que la modelisation contenue dans le programme PHONO n'est 
pas uniquement linguistique puisque Tapplication des regies phonologiques repose aussi sur 
une modelisation qui est faite d*un locuteur typique d'une variete linguistique. 



•Communication pr^scnWe Xan du 66® Congris de TACFAS, Moncton, 9-13 mai 1988. 
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b) En ce moment, la modelisation des regies phonologiques et des confextes extra-Iinguistiques 
contenue dans PHONO est partielle, d*une part, parce que PHONO est un prototype qui ne 
traite qu*un nombre restreint de regies et d*autre part, parce qu*il est pratiquement impos- 
sible de formaliser toutes les regies phonologiques pour toutes les varietes utilisees dans 
une ou plusieurs communautes iinguistiques. II en va de mdme pour la modelisation des 
facteurs extra-Iinguistiques puisque la recherche n*est pas suffisamment avancee pour 
forrauler toutes les contraintes qui tiennent compte de la position du locuteur dans la 
cow munaute linguistique ou de Tef f et de la situation de communication sur la representation 
phonetique. 

c) Variete litti^uistique est retenu ici au sens tres large. Tout «parler» commun t un groupe 
de locuteuis et utilise dans un contexte extra-Iinguistique specifique constitue une variete 
linguistique. II n*existe t notre connaissance aucune typologie des varietes Iinguistiques au 
Quebec. Concretement, pour PHONO, une variete linguistique est definie en fonction de 
Torigine geographique et sociale du locuteur qui est actualise. Son appartenance a tel ou 
tel groupe d*age peut aussi participer t la determination d*une variete linguistique. Jus- 
qu*ici, PHONO ne tient pas compte de Tevenement de communication lui-mdme ni des 
autres protagonistes. 

d) La modelisation contenue dans PHONO se situe avant tout au niveau phonologique en ce 
sens que les contraintes purement phonetiques ne sont pas traitees. Par exemple, PHONO 
ne tient nullement compte de Tallongement de la voyelle devant consonne sonore et de son 
abregement devant consonne sourde. 

e) L*appIication des regies de transformation de la structure phonique est en general variable 
^n ce sens qu'elle se fait en fonction de la probability d'application de chacune des regies 
dans un contexte linguistique et extra-Iinguistique donne. Par exemple : la rdgle d*affri- 
cation de t/d s*applique dans notre systeme de fa?on presque categorique pour tous les 
locuteurs sauf pour les Beaucerons qui palatalisent les mdmes consonnes dans les m^mes 
contextes; inversement, Tapplication de la r^gle de diphtongaison de /wa/ est fonction de 
Torigine geographique du locuteur et de son appartenance i Tune ou Tautre classe sociale. 

PHONO comporte, malgre ce qui vient d*Stre souligne, un mode categorique, c'est-^-dire la 
possibility d*actualiser un locuteur qui, dans son discours, realise le plus grand nombre possible de 
regies et/ou les regies les plus susceptibles de s'actualiser. 



IV Structure g^nivale du programme (cf. figure 1) 

Le programme tel quMI existe k Theure actuelle comporte les routines et les structures de don- 
nees qui apparaissent t la figure 1. Certaines des routines sont integrees au programme PHONO lui- 
mSme alors que d'autres, notamment la routine d*instaIIation des caracteres phonetiques et de 
specification des phonemes en traits distinctifs, sont implantees et chargees de fa^on autonome. 

Le programme commence par installer les symboles phonetiques qui sont necessaires pour fournir 
une representation phonologique et pour generer la representation phonetique. Puis, une ma trice de 
traits di';tinctifs pour les phonemes utilises est chargee en memoire & partir du disque. 

En troisieme lieu, PHONO demande que Pusager actualise ou qu'il cree un contexte extra-Iinguis- 
tique. On verra plus loin en quoi consiste precisement un contexte extra-Iinguistique. A mesure que 
des contextes sont crees, ils sont sauvegardes sur disque et peuvent dtre rappeles ulterieurement. 
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FIGURE 1: 



Structure g^n^rale du programme PHONO 
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application de rigles 
phonologique* 
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^ representation phon^tique j 
et des rigies 



Ces tAches preliminaires accomplies, PHONO demande a Tusager d*entrer une representation 
phi nologique. Lorsque la chaine de symboles phon6tiques est entree, le programme syllabe automatic 
quement le mot et cherche i appliquer les regies phonologiques qui sont implant6es. Les regies 
comportent des conditions ou des contraintes linguistiques et peuvent aussi comporter des contraintes 
sociales. Le balayage de la representation se fait sequentiellement de gauche a droite mais peut 
comporter des retours arrisres. 

Le travail d*application des regies achevc, la representation phonetique derivee est affichee de 
mdme que le nom des regies qui ont ete appliqu6es. 



V Installation des symboles phon^tiques 

Les symboles phonetiques utilises ont et6 crees et sont charges a Taide du pro- 
gramme CHARGENL Les symboles phonetiques utilisent les positions du jeu de caracteres ASCII 
etendu avec la carte CGA. 
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VI Ch^jrgement des traits distinctlfs (cf» figure 2) 

Un programme exteriear i PHONO permet rit specifier par une matrice de t'-aits les 
pi >niimes et^ les allophones necessaires pour les varietes de frangais quebecois qui sont 
molelisees ici. Les phonfemes sont caracterises par une serie de traits articulatoires. Une autre 
matrice de traits disf actifs auraient pu dtre choisie, rr^^i^ comme le projet initial en etait un de 
didacticiel, il a ete juge plus commode sur le plan p.dagofeique de retenir un vocabulaire de traits 
icuiatoires. 



^ Les donnees generees par le programme de specification TRAIT sont stockees dans un 
fichier PHONEME.DAT, Ce sont ces donnees qui sont chargdes par PHONO et qui sont 
utilisees dans I'application des regies. En effet, Tapplication des regies ne se fait pas 
sur des phonemes specifiques mais sur des entit6s partageant le mfime ensemble de traits 
distinctifs. 



FIGURE 2: 
Matrice de traits artlculatoires 



ooeioGM: 



pocUrmre: 
oatrile: 



tocrde: 



ai-ovrtrte: 
ocverte: 



orile:x 
&«s:Iei 
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teod;K:x 
Uche: 



erJc 



VII Spficification du contexte extra-lingulstique (cf, figure 3) 

La matrice de traits pertinents chargee, PHONO deman-^A ^ Tusager s'il desire caracteriser le 

, -J »*i*o^*'»"M"»^«aiw icqiicii aCiuamauuii uc la rcpi<,.vniauon pnonologique prendra place. 

Pour le moment, ce que PHONO «entend» par contexte extra-linguistique est assez limite, Essentiel- 
lement, le contexte est restreint k certaines caracieristiqu^s du locuteur : sexe, ^ge, irctruction, et 
origin/' geographique. La figure 3 montre Tecran de definition d'un contexte. II va sans dire que 
d'autres parametres extra-linguistiques pourraient Stre pris en consideration. Mais o\nme il existe 
peu de donnees precises sur I'influence, par exemple, du contexte physique ou psychologique, sur 
Tapplication de telle ou telle regie, PHONO se limite aux facteurs lies k la position du locuteur dans 
la communaute linguistique. Les contextes definis sont stockes sur disque et peuvent etre rappeles en 
tout temps. 
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£cran de definition d^un contexte extra-linguistique 
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L'usager a aussi le choix de refujer de definir un contexte extra-Hnguistique. En 
faisant cela, il place PHONO dans un mode d'appHcation obligatoire ou categorique des 
regies. En mode categorique, PKONO applique le plus grand nombre possible de regies. En 
d'autres mots, la probabilite d'application des regies variables, t quelques exceptions pres, 
passe & 1. 



VUI Algorithme de syllabation (cf« figure 4) 

Le contexte extra-linguistique defini, PHONO demande k Tusager de lui f ournir la representation 
phonologique qu'il veut voir trait6e. Puis il entreprend de syllaber la chaine de phonemes. L'algo- 
rithme de syllabat'on est presente d, la figure 4. 



L*op6ration de syllabation comporte trois phases. Pour minimiser les regies possibles de 
syllabau>a, PHONO utilise les contraintes sur les positions pp:>sibles des semi-consonnes et 
des iiquides dans ia syiiafae en frangais. Ainsi on sait que les semi-consonnes, k i'excep- 
tion de yod dans des mots comme paye ou fille, ne peuvent apparaitre que devant ia 
voyelle de la syllabe k laquelle appartient la semi-consonne. De meme la liquide qui suit 
une consonne qui n'est pas une liquide appartient k la m&me syllabe que la voyelle qui 
suit. 



Ainsi, PHONO commence par retrancher les semi-consonnes et les Iiquides qui suivent 
une consonne non-liquide. Puis il cherche & appliquer autant de fois que possible une 
des 5 regies de syllabation. Enfin, il replace les semi-consonnes et les Iiquides qui ont 
et6 temporairement retranch6es. Ce processus en trois etapes a Tavantage de minimiser le 
nombre de regies de syllabation et d'ameliorer consid6rablement les temps do traitement. 



Ainsi un mot comme accroire /akrwar/ est reduit en un premier temps k /akar/ puis syllabe en 
/a#kar/ et enfin reconstitue pour retrouver /a#krwar/. 
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nCURE 4: 
AlgorUhme de syllabation 



U49 d'ttttt Mp r Ai«tt UUoo / 



1 




APPUCATIOH X>t9 RtQLES DS SYUABATION 
CV CV CV# CV 

CVCV > CV#CV 

CVW » CV#V 

vccv » vc»cv 
vcccv— ».vc#ccv 



IX Ragles isipIaGlies actucllcsioat 



Les regies phonologiques implantees actuellement sont les suivantes 



VOYELLES 
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allongement des voyel'tcs longues par nature et des voyelles devant /v (vr), z, r/ 
(variable) ^ 
diphtongaison des mi-ouvertes (variable) 
diphtongaison des longues par nature (variable) 
diphtongue /wa/ (variable) — partiellement 
fermeture du /a/ posterieur en finale (categorique) 
posteriorisation du /a/ en finale (variable) 
reiachement des voyclles fermees (categorique) 

36 
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affaiblissement de la consonne /3/ (caiegorique) 
affrication de /t,d/ devant / i> y, (categorique) 
aspiration des consonnes occlusives sourdes (variable) 
aspiration de /// (categorique) 

.chute des consonnes d*un groupe consonantique final (variable) 
palatalisation de / t, d/ en Beauce (variable) 
simplification du groupe /n/ + /y/ en /r/ (categorique) 

Le programme commence par determiner le mode articulatoire du premier segment de la chaine. 
Selon qu'il s'agit d'une voyelle ou d'une consonne, il cherche ensuite H appliquer une des regies 
appartenant soit au groupe de regles-consonnes soit au groupe de rfegles-voyelles. Si aucune regie ne 
peuts'appliquer, le pointeur se deplace sur le deuxieme segment et le travail d'examen et d'applica- 
tionse r6pete. Si une regie est susceptible de s'appliquer, cependant, PHONO verifie un ensemble de 
conditions linguistiques ou extra-linguistiques, puis, si toutes les conditions sent rencontrSes, precede 
4 la transformation du segment. Dans le cas oil la regie s'applique, le programme memorise la posi- 
tion du segment transforms ainsi que le type de rSgle qui s'est appliquee. Selon la regie appliquee, le 
pointeur peut ou non se deplacer vers le segment suivanl. 

Prenons i'ex^mpie de la regie d'aliongement : 

Telle que definie dans PHONO, la regie d'allongement ne peut s'appliquer que : 



A : (premier groupe de conditions) 

1- si la voyelle examinee n'a pas deji ete allongee, et que 

2- si le segment qui suit est une consonne, et que 

3- si la voyelle est une voyelle tendue (e, o, ^, g,a, 3,S) ou une voyelle non- 
tendue et, dans ce dernier cas, que si la consonne qui suit est une cons- 
trictive sonore (/ v (vr), 5, z , r /) finale. 

ou 



B : (second groupe de condi.Mons) 

1- si la voyeUe est tendue (e, 0 , g, 5, 3,S), er que 

2- si la voyelle est en syllabe ouverte non finale. 



Si le premier groupe de conditions a ete rencontr6, Tallongement est categorique. Si c'est le 
second groupe de conditions qui a ete rencontr6, Tapplication de la regie se fait de fa?on facultative. 
Nous avons donne arbitralrement, faute de donnees precises, une probabibilte de 20% d'application 
dans at cas. 

Un calcul de probabilite d'application est ensuite effectue. Si la regie s'applique, le segment est 
alors note comme allonge. 

Quand la regie d'allongement s'est appliquee, le pointeur n'est pas deplace vers le segment 
suivant. PHONO verifie s'il peut appliquer d'autres regies sur la voyelle allongee, nctamment si la 
diphtongaison est possible. Chacun des segments de la representation phonologique est ainsI iralte au 
moins une fois. 

EMC 
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X Dfiveloppef. ts futur. 

Le nombre de regies implant6es dans PHONO est actuellement relativement limite. 
Cependant I'infrastructure du programme etant deji en place, ce sera un travail relative- 
ment facile d'ajouter d'autres regies au canevas de base. Les regies dont le domaine 
d'application est le mot seront d'abord considerees. Puis seront considerees les regies dont 
le domaine peutStre extra-lexical mais dont les contraintes demeurent uniquement d'ordre phonolo- 
gnue. Toutes les rfegles qui obeissent k des contraintes d'ordre syntaxique sont evidemment exclues 
pour un certain temps. 

Nous examinerons si I'ajout d'une interface sonore capable de produire un signal correspondant a 
la representation phon6iique generee par PHONO est de I'ordre du possible. 

Les regies telles que formulees pr&entement ne sont pas toujours completes ou adequates. II 
faudra done raffiner la formulation de certaines regies. 



XI D^moastration 

On trouvera aux figures 5 et 6 deux exemples d'ecrans generes par PHO- 
NO. L'usager fournit une representation phonologique («Mot en API : »), le programme 
syllabe automatiquement et affiche le resultat' de I'operation de syllabation, puis procede 
i I'apphcation des regies en fonction du contexte extra-linguistique tel que specific dans 
le rectangle situe au coin superieur droit de I'ecran. Le resultat de I'operation est 
aftiche dans la troisieme fenStre et le nom des rSgles appliquees est inscrit sous cett» 
demiere. 



FIGURE 5: 

Syll.^abation du mot "routine" 
et application d<>. regies phonologiques 
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Mot en API: autin 












Motfyllftb^: bu»t!n« 



Mot z^R6Ti: t^u*^ 


In* 




AfTrication de t/d 

1 RelSchement des voyelles ferm^et 
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FIGURE 6: 

Syllabation du mot '^ordlnateur" 
et application de regies phonologiques 



Mot en API: osdlnatoaa 



Rpb«rt 



Mot giniti: OB*[*jl#na#ta »» 



AfTrication de t/d 
I M 



longement dev&nt /r, v(':^, r/ 
Diphtongalson det mi-ouvertet 
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Introduction 



Depuis plus de vingt ans d6j&, le Bureau des traductions du Secretariat d*Etat participe active- 
ment A des travaux de recherche et de d6veIoppement en matiere de traduction assistie par ordinateur 



L*int6r6t du Bureau pour la TAO s*imposait de lui-mftme en raison de Taccroissement constant et 



Le Bureau des traductions est Tun des plus grands au monde» avec un effectif de pius de 1 500 
personnes. Ghlce k sa banque de terminologie, Termium III, ses quelques 300 postes de travail, ses 25 
compte-mots, son syst^me de traduction automatique M£t£0 et ses travaux de recherche et de deve- 
loppement, le Bureau des traductions est consid6r6 par les communautds natlonale et internationale 
comme itant Tun des plus avant-gardibte en matiere d*int6gration de services informatises. 

II existe au Canada une tr^s grande activity en traduction, qui r^pond t des imp^ratifs politi- 
ques, culturek, sociaux et 6conomiques. On peut estimer prudemment k quelque 600 millions de mots 
(4 000 ouvrages de 500 pages) le volume annuel de traduction au Canada. 

Cet accroissement de la demande n*est pas exclusif au Canada. Par exemple, Van Slype et coll. 
estiment que le volume annuel de traduction dans le monde se situe entre 20 et 60 milliards de mots, 
et le coflt cvalue i 1,6 i 4,8 d*ECU (environ 1,7 ^ 5,8 millions de dollars canadiens) (Van Slype, 
1981)- En outre, ce volume annuel augmenterait de 9 i 10% chaque ann6e. 

Plusieurs grandes socict6s manuf acturieres exportairices se sont iotees d*un important sei vice de 
traduction afin de satisfaire les exigences linguistiques de leurs clients. Pour les entreprises de haute 
technologie, cela n*est pas une tache facile. Par exemple, la documentation relative a un element 
d*un *^;-.^5pement complexe (par exemple, un ordinateur, une g6n6ratrice d*6Iectricit6, etc.) peut com- 
porter des millions ou des dizaines de millions de mots. En fait, la documentation relative aux equi* 
pements complexes reprisente toujours une part imt>ortante des coQts de production de tels produits. 
Selon Brinkman, de la multinationale allemande Siemens, cette part atteint, dans certains cas, 50% 
du prix de revient d*un produit (Brinkman 1979). 



1. Phase I (1965 - 1970) 

Le Centre d*6tudes pour le traitement automatique de donnees linguistiques (CETADOL) est cree 
^ Tuniversite de Montreal sous la direction de Guy Rondeau. Les etudes et recherches prell^ninaires 
de ce centre sont orie^'^es vers la conception d*un systeme de traduction automatique de deuxieme 
gendraUon. 



Comtnunication pr6«entie Ion de la Deuxiime ConKr«nce des chefs d*£tat et de Gouvemement de p9yt a/ant en 
commun I'luage du fran^ab, touf le ihhme : Induetrie de la langue^ Quebec, 5 septembre 1987. 



(TAO). 
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Ainsi les recherches portent principalement sur les nouvelles theories linguistiques (ex. la gram- 
maire generative - transformationnelle), la theorie des automates et des grammaires f ormelles, Texpe- 
rimentation des principaux algorithmes d^analyse syntaxique existants (ex. les algorithmes Cocke, 
Kuno- Woods, Sakai, etc.), la mise au point de nouveaux formalismes informatiques (ex. les W-gram- 
maires), la formalisation des structures de representation de Tinformation et, enfin, la description et 
la formalisation de divers phenomenes linguistiques (ex. en morphologie, en syntaxe et en semantique). 

Durant cette premiere phase jusque vers 1972, le Conseil national de recherches du Canada 
finance la recherche fondamentale. 



2. Phase II (1970 - 1976) 



Au debut de 1970, le CETADOL precise son orientation et devient le Groupe de recherche en 
/raduction flutomatique de Twniversite de A/ontreal (TAUM) sous la direction successive de Alain 
Colmerauer et de Richard Kittredge. 

On s'engage dans la conception, le developpement et la mise au point du premier prototype d'un 
systeme de traduction automatique de deuxieme generation. Ce premier prototype s'appelle 
TAUM-71. Suivent les prototypes TAUM-73, TAUM-75 et TAUM-76. 

Concurremment, on travaille k la conception, au developpement et h Timplantation de divers 
langages de programmation de haut niveau (ex. Syst^raes-Q, TARZAN, REZO). 

A partir de 1973, le Bureau des traductions du Secretariat d'Etat prend en main la poursuite de 
la recherche et du developpement de systemes. 

En 1975-1976, TAUM fait la conception, le developpement et la mise au point du systeme TAUM- 
METEO pour le compte du Bureau des traductions. En 1976, TAUM livre le prototype TAUM-METEO 
au Centre meteorologique canadien (CMC). Le systeme METEO, comme on le nomme aujourd'hui, 
demeure k ce jour le seul systeme de traduction automatique de deuxieme generation au monde pou- 
vant fonctionner jour et nuit, 365 jours par annee. 



3. Phase III (1976 - 1980) 

En 1976, le groupe TAUM et le Bureau entreprennent de relever un defi de taille : la concep- 
tion, le developpement et la mise au point d'un systeme de traduction automatique de deuxieme gene- 
ration en vue de traduire les manueis d'entretien de I'avion AURORA (CP- 140;, le nouveau patrouil- 
leur maritime du ministere de la Defense nationale. 

En 1979, T lUM fait une demonstration du prototype TAUM- AVIATION. Si le systeme TAUM- 
AVIATION se revele alors 6tre en mesure d'aider k la traduction des manueis d'entretien des circuits 
hydrauliques, il ne pourra vraisemblablement pas servir k traduire les autres manueis, k molns d'autres 
• "^ortants investissemeni's tant en matiere de developpement que de recherche. Une evaluation des 
'..u^ts-ayantages sMmpose done. Toutefols, les progres techniques et scientifiques accomplis depuis la 
ccncepiion du systeme METEO sont tres importants, car TAUM a mis au r ;nt une technologie de 
deuxieme generation qui se range parmi les plus avancees au monde. 
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4. Phase IV (1980 - 1983) x 

4.1 Evaluation , • 

En 1980-1981, le Bureau precede ^ une evaluation des coOts-avantges du systems T{JuM- 
AVIATION. On tente alors d'evaluer la performance linguistique du systeme et d'en ^nalj^^er les 
coOts de developpement et d*expIoitation. •*> 

devaluation conclut d'abord que le systeme donne des resultats satisfaisants quand il^projfult une 
traduction. Par exemple, la cote generale attribute a la portion traduite de rechantiliott.t3^t, des 
points de vue de Tintelligibilite, de la fidelite et du style, represente environ 80% de la traduction 
humaine. De plus, on note que les coOts directs de la traduction automatique revisee p^fquiraient 
devenir inferieurs ^ ceux de la traduction humaine. Toutefois, le coOt de creation des dictignnaires 
ei de maintien d'une equipe d'exploitation a un impact negatif sur la renubilite eventuelle de la 
traduction automatique des manuels du CP-140 a Taide du systeme TAUM- AVIATION. Enfin^ p jur 
rentabiliser ce systeme, il faut que deux conditions soient remplies simultanement : la reduction, des 
coOts directs de la traduction automatique et la traduction au moyen du systeme de 5 a 6 millions de 
mots par annee. A la lumiere de cette evaluation, on estime qu*il est impossible d'affirmer que le ^ 
systeme TAUM- AVIATION peut, dans un avenir previsible, se reveler plus rentable que la traduction 
humaine en raison surtout des coOts indirects (ex. fabrication des dictionnaires et exploitation du 
systeme). 

4.2 Etude de la faisabilite de la traduction automatique /* 

En 1981, le Bureau effectue une etude de faisabilite sur la traductigii. auftomatique. 
Les principaux objectifs de cette etude consistent k mesurer les possibilites d'exteri^n du systeme 
TAUM- AVIATION aux manuels d'electronique du CP- 140, a rechercher les textes cdTtfie^^u Bureau 
quise prdteraient le mieux a la traduction par ordinateur, a evaluer divers systemes do^iKerciaux de 
traduction et a produire un rapport recommandant des priorites et un plan d'impIant^tcSii, s'il y a 
lieu. Les conclusions de cette etude sont les suivantes : v 

a) Le systeme TAUM- AVIATION peut etre applique aux manuels d'electronique du CP- 140. 
De plus, ce systeme est en mesure d'en produire des traductions comparables a celles 
obtenues dans le domaine de Thydrauhque. Toutefois, le coti de fabrication des diction- 
naires d*eIectronique demeure Tinconvenient principal. 

b) Les avis de concours, les descriptions de fonctions et le Journal de^ marques de commerce 
semblent satisfaire aux criteres de volume, de repetition ou d'urgence al rs retenus pour 
cholsir les domaines prioritaires d'application de la traduction automatique. Tc itefois, ct.,. 
etude n'a pas permis d'etablir des criteres scientifiques permettant d'evaluer la complexite 
linguistique d'un texte afin de determiner s'il etait possible de le traduire par ordinateur. 

c) Parmi les systemes commerciaux etudies, SYSTRAN II, WEIDNER ct ALPS semblent les 
plus prometteurs. Toutefois, avant de recommander ou, encore, d'envisager Timplantation 
d'un de ces systemes, il est suggere d'effectuer un certain nombre d'essais. 



4.3 Evaluation et essai de systemes commerciaux 

En 198 1 -1982, a Bureau fait un essai et une evaluation du systeme ALPS. A la suite de cet 
essai, on conclut que le systeme ALPS presente des faiblesses en matiere d'analyse de la langue- 
source et de generation de la langue d'arrivee et qu'il n'offre done pas le niveau d'aide require pour 
la traduction des avis de concours, des descriptions de fonctions et du Journal des marques de com- 
merce. 

er|c 4.: 
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En 1982, le Bureau lance una demande de propositions afin de solliciter des offres de systemes 
de traduction automatisee aptes a uder k la traduction des a^io de concours, du Journal des marques 
de commerce et des descriptions de fonctions. Seul le systeme Weidner est retenu et, apres les 
epreuves, ne se revele pas superieur au systeme ALPS. 



4.4 Autres etudes 



En 1983, le Bureau entreprend I'elaboration d'une methodologie generale d'e valuation Unguis- 
tique de systemes de traduction automatisee. L'objet de cette methodologie est de detinir et 
d'expliquer en detail les principaux elements i evaluer avant de proceder a I'essai ou a Tachat d'un 
systeme de traduction automatisee. 



En 1983 egalement, le Bureau subventionne une etude portant sur I'elaboration de criteres scien- 
tifiques pour determiner la complexite linguistique des testes i traduire et, ainsi, les classer par ordre 
de difficulte croissante. Des echantillons de 17 types de textes que traduit le Bureau servant de 
matiere k cette etude qui revele que certains types de textes sont k la portee de la technologie de 
deuxieme generation comme METEO ouTAUM- AVIATION, maisleur tres faible volume nejustifie 
pas le developpement immediat de systemes. D'autre part, iis sont tous, sans exception, hors de la 
portee des systemes moins evolues sur le plan de I'analyse de la langue-source. 



5. Phase V (1984 - 1987) 

5.7 Relance de la recherche et du developpement au Canada 

Le Bureau s'emploie activement t promouvoir la recherche et le developpement au Canada en 
matiere de TAO. Le Bureau, toujours convaincu de la justesse, de Toriginalite et de Tavancement 
technique et scientifique des travaux canadiens en TAO, sollicite divers appuis au sein du gouver- 
nement canadien sfir de mieux encadrer les investissements qui pourraient etre faits dans ce domaine. 

Cest ainsi qu' in juillet 1983, le Secretariat d'Etat et le ministere des Communications se con- 
certaient pour conf ier k la societe Quasar Systems Ltd, maintenant la Cognos Corporation, une etude 
sur le traitement automatise des langues naturelles et sur Tapplication de Tintelligence artificielle ^ 
ce domaine. 

Le rapport Cognos, presente en 1984, recommandait trois onts sur lesquels la recherche et le 
developpement pouvaient gtre poursuivis et entrepris concurremment. lis constituent maintenant les 
objectifs qui sous-tendent la collaboration entre le ministere des Communications et le Secretariat 
d'Etat : 

a) la mise au point d'un poste de travail professionnel dans le contexte de la bureautique, t 
titre de projet k court »erme; 

b) le raffinement de la technologie de traduction automatique de deuxieme generation, telle 
qu'elle est representee par le prototype TAUM- A^^ATION, et son application ^ des textes 
plus compliques que les bulletins meteorologiques, mais moins que les manuels d'entretien 
d'avions, textes qui offriraient un volume suffisant et se situeraient dans un sous-langage 
defini, k titre de projet i moyen terme; 

c) la recher^' he et le developpement d'une technologie avancee de .iaductlon automatique ayant 
recours k des techniques d'intelligence artificielle et de traitement des langues naturelles. 
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5.2 Paste de travail du traducteur 

Le projet de developpement d'un poste de travail pour traducteur canadien a ete conf ie au 
Centre de recherche en informatisation du trava?^ XCRIT). A I'ete 1985, le CCRIT commandait ^ la 
firme Socioscope Inc. une etude visant k defiu^; les c ^racteristiques fonctionnelles du poste. Le 
rapport, depose en 1985, proposait d'automatiser toute une gamme de fonctions qui exigeaient parfois 
le recours k des techniques tres avancees et tres codteuses, mais il ne les classait pas par ordre de 
priorite et n^examinait pas les produits disponibles sur le marche qui auraient pu Stre adoptes i court 
terme. Le CCRIT a done repris les conclusions du rapport afin de faire ressortir les composantes les 
plus importantes et les plus rentables i inclure. II est prevu qu'^ T'lutomne de 1988, un prototype 
pourra dtre mis a I'essai dans un certain nombre de services de traduction. 



5.3 Etudes de marche 

Afin de demontrer aux chercheurs et au monde des affaires la viabilite economique du creneau 
de la TAO et de les inciter k investir temps et argent, le ministere des Communications et le Secre- 
tariat d'Etat confiaient en janvier 1987 i la firme Coopers & Lybrand Consulting Grout^ I'execution 
d'une etude de marche portant sur les facteurs suivants : la demande et I'offre en ^-^ysteme de 
TAO, la capacite de Tindustrie canadienne i faire face i la demande, sa competitivite par rapport aux 
autres pays et les possiblites d'investissement. Le rapport definitf, qui presentera des recomman- 
dations quant aux mesures a prendre, est prevu pour septembre 1987. 



5.4 Evaluation de systemes de TAO 

Le Bureau de.s traductions continue d'evaluer les systemes commerciaux d'application generale. 

En 1985, il met ^ I'essai le systeme MicroCat de Weldner sur quatre types de textes choisis pour 
leur style assez egal. Au bout de quatre mois, la conciysion ssfque le systeme n'est pas rentable 
parce que la mauvaise qualite des trad^-^tiofir bilTces exige trop de post-edition. 

En mars 1987, un protet d'un an est lance daa: les .'services de traduction a Montreal, avet la 
societe Logos. Pendant cecte periode, truis traducteurs du Dureau el trois experts du constructeur 
utilisent trois versions successives du logicitl afin de traduire de i a?on operationnelle des textes d un 
gros volume dans le domaine de I'informatique (deux autres domaines pourront dtre envisages ulte- 
rieuremeat; et de recommander des ameliorations au constructeur. Au terme de I'experience, le 
Bureau aura de. ionnees precises sur la rentabilite du systeme et disposera, vraisemblablement, d'un 
systeme taille sur mesure pour repondre d, une '-»me demande. 



5.5 Programme national de recherche et de developpement 

Le ministere des Communications a prepare un memoire au Cabinet, appiOuve en juin 1987, 
destine k la mise en p!ace d'une strategie canadienne sur les lechnio.. de I'information et les com- 
munications. Cette strategie sous-tendra un futur p.oramme national de recherche et de develop- 
pement en TAO. 
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DIX ANS DE METEQi 

John Chandioux 
Experts-conseils Inc. 



Introduction 

METEO est an systfeme de traduction automatique anglais-fran9ais exploite par le Bureau des 
traductions du Secretariat d'Ecat pour le compte d'Environnement Canada. Le systeme traduit le^ 
previsions m^teorologiques destinees au grand public emises pour I'ensemble du Canada et fonctiorine 
24 heures par jour. La charge du systems est superieure i 30 000 mots par jour; le taux de revision 
est de Tordre de 5% et le prix de revient du mot-machine brut est inferieur i un demi cent. PIuc 
etonnant encore, le premier systeme MET^IO a ete implants voici plus de dix ans et on le cite er.core 
aujourd'hui comme Tun des rares succfes de la traduction automatique. 



Un peu d'histoire 

Le prototype du premier systeme METEO a ete de veloppe par le groupe TAUM de Tuniversite de 
Montreal en 1975-1976 dans un langage appele Syst6mes-Q. 

Apres avoir ete mis au rancart pendant un an, la bande magnetique du systeme TAUM-METEO a 
ete confiee par le Bureau aes traductions fi ia societe Consultants en linguistique compu- 
tationnelle limit^e, qui a deveIopp6 la premiere version commerciale, connue sous le nom de METEO 1 . 
Le passage du prototype ^ Texploitation ne s'cst pi:? fait sans surprise. Le systeme TAUM-METEO ne 
traduisait effectivement que 40% des phrases renrontrees et il a fallu une annee de developpement 
supplemi^ntaire pour que le systeme METfiO 1 atteigne le taux de 80% vise au depart. 

En 1982, la societe John Chandioux experts-conseils Inc. a termine le developpement d'un nou- 
vcau langage de programmatlon, appele GramR, et a ete chaxge par le Bureau des traductions d'etudier 
la faisabilite d'une traduction automatique sur micro-ordinateur. Peu apres, !a societe commen^ait a 
developper de sa propre initiative un nouveau systeme, baptise METEO 2. 

En 1983, le Bureau des traductions a accorde a la societe John Chandioux experts- 
conseils Inc. un contrat pour un essai compare de trois mois des systemes METEO 1 et METEO 2. Le 
resultat de Tessal a revele que le systeme METEO 2 est plus performant, plus fiable et plus convivial 
que son pvedecesseur. 

Dppuis le 10 octobre 1984, le Bureau des traductions loue le systeme METEO 2 avec une formule 
«cle en main» qui comprend les ordmateurs, les logiciels, le service 24 heures par jour et la mise a 
jour des dictionnaires selon les besoins. 
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Un conflit de generations 

Commengons par situer le systeme METfiO dans Thistoire de la traduction automatique. Au 
depart, la recherche est un reliquat de la guerre froide et a 6te subventionnee massivement par les 
mihtaires vers la fin des annees 50, d'abord aux Etats-Unis, puis en France. Le probleme de la 
traduction automatique etait alors assimile k un simple probleme de decryptage donnant naissance aux 
systemes dits de premiere generation. Ceux-ci se composent d'un gigantesque dictionnaire auquel on 
associe une analyse du contexte, generalement limitee aux deux mots qui suivent et qui precedent le 
mot courant. On peut ainsi trancher certaines ambiguites grammaticales. 

Le plus connu de ces systemes est le systeme SYSTRAN utilise par la Foreign Technology Divi- 
sion de PArmee de Pair americaine. Le systeme donne une traduction sommaire de tous les textes 
scientifiques en langue russe que le service peut obtenir* Les traduction brutes sont ensuite exami- 
nees par des specialistes qui identifient les textes ayant un interfit strategique et ceux suscepdbles 
d'mteresser la communaute scientifique. Les quelques textes retenus sont en general retraduits ma- 
nuellement. 

En 1966, un rapport de la National Science Foundation concluait k Timpossibilite de la traduction 
automatique et donnait un coup de gr&ce i la recherche. La publication de ce rapport ne tenait pas 
compte de Temergence d'une deuxieme generation de systemes. 

Le systeme de deuxieme generation possede trois caracteristiques fondamentales : 

1- il est programme dans un langage evolue, directement accessible au linguiste; 

2- il analyse la totality de chaque phrase; 

3- il effectue la traduction en trois phases appelees ANALYSE, TRANSFERT et GE- 
NERATION. 

_ Cette derniere distinction correspond aux trois etapes fondamentales de Toperation de traduc- 
tion : I/ar comprehension du texte-source, la transposition de Tidee et la formulation de Pidee 
resultante dans la langue-cible. 

^ Le systeme METEO est la premiere application commerciale de la deuxieme generation et serait, 
si Ton en croit certains specialistes, la seule i ce jour. 

Depuis, la troisieme generation de traduction automatique a vu le jour dans les laboratoires de 
recherche. Le systeme de troisieme generation associe au systeme de deuxieme geneidtion une base 
de connaissances dans laquelle le systeme peut puiser pour trancher les ambiguites de sens. 

Le langage GramR ('^^) 

La partie traduction du systeme METEO 2 est ecrite dans un metalangage appele GramR. Tech- 
niquement parlant, il s*agit d'un transducteur de chaines d'arbcrescences parametrees. Pratiquement 
parlant, il permet au linguiste, familier avec le formalisme de la grammaire transformationneile deve- 
loppee par Chomsky, d'ecrire son modele linguisticjue sous forme de regies, de le compiler et de 
I'evaluer sur dec exemples de son choix. 
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Le developpement du langage GramR a ete fortement influence par les travaux du Groupe d'Etu- 
des pour la Traduction Automatique de Grenoble et nous sommes |.articulidrement redevables au re- 
grette professeur Bernard Vauquois pour ses nombreuses suggestions et ses encouragements. 



En 1982, GramR etait le tout premier langage de deuxieme generation sur micro-ordinateur; 
aujourd*hui U a fait ses preuves dans un grand nombre d'applications : la traduction auton 'que 
(M6t£0 2), la detection de fautes d'orthographe (SpellR), I'accentuation automati'^ue (Ac ,nts), 
I'enseignement du frangais (Le Groupe Nominal) et les interfaces en langue naturelle (EASY-DOS). 



Enfin, le langage GramR est desormais disponible en versions MS-DOS, UNIX 68000 
et VAX VMS. 



Les grammaires 

Les grammaires du systfeme METEO 2 effectuent une analyse complete de chaque phrase avant la 
traduction. On pourrait penser que le fait de travailler sur des textes en langage telegraphique 
faciliterait la tSche ; il n'en est rien. Ce type de texte est entiSrement en majuscules, pratiquement 
sans pCuCtuatioR et les mots sur iesquels reposent une analyse automatique conventionnelle, teis que 
les conjonctions, les articles et les propositions, sont souvent absents. Pour cette raison, I'analyseur 
du systeme MfeTEO 2 est beaucoup plus semantique que celui utilise dans le systeme prototype pour la 
traduction de manuels d'informatique. 



Fort heureusement, la semantique d'un micro-monde comme la meteorologie est facile k circons- 
crire. Un Ononce bien forme se resume en general k une condition met6orologique, souvent limitee 
dans le temps ou dans I'espace. Cette condition pouvant debuter, se maintenir, cesser ou faire place 
k une autre. 



Les quinze grammaires du systeme METEO 2 se divisent en cinq types fondamentaux : 



1 La pr£-'£dition. Ces grammaires ont pour objet d'Oliminer les redondances ou les mots non 
significatifs, de normaliser certaines formulations, d*identifier les expressions idiomatiques 
et de developper les abreviations. 

2- Le dictlonnaire. Le dictionnaire associe k chaque adjectif, nom, ou verbe, la categoric 
syntaxique et certaines informations semantiques et morphologiques utilisees par les gram- 
maires suivantes. 

3- L'analyseur. L'analyseur identif ie d'abord les groupes nominaux et les ventile en condition: 
meteorologiques, en circonstanciels de temps et en circonstanciels de lieu. Cette partie de 
Tanalyse repoSw sur les compatibilites et incompatibilites de classes semantiques. Puis vient 
Tanalyse du groupe verbal et sa combinaison avec les groupes nominaux en enonces bien 
formes, 

4- La g6n6ration syntaxique. Ces grammaires operent une serie de transformations sur le 
resultat de I'analyse afin de generer les mots de la phrase-cible dans le bon ordre. 

5 La g6n6ratlon morphologlque. Ces grammaires traitent les problemes d'accord en genre et 
en nombre, d'elision, de contraction et effectuent d'ultimes ajustements stylistiques. 

On remarquera que la phase de transfert de la definition du systeme de deuxieme generation 
semble avoir disparue. En fait, le transfert est effectue au niveau du dictionnaire et surtout de 
Tanalyseur. Ceci decoule en partie du fait que I'analyse est plus semantique que syntaxique. 
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L'environnement MfiX^lO 2 

Le systeme M£t^:0 2 ne se limite pas i une serie de grammaires en langage GramR; il s'agit 
d'un environnement CGtnplet qui totalise plus le 10 000 lignes de programmation. Le cheminement 
d*ua bulletin est le suivant : 

GERTELEX, le logiciel de communication, lit la ligne TELEX, isole les bulletins a traduire, prend 
note de Tindicatif du bulletin, du nombre de caracteres et de I'heure d'arrivee, puis met le bulletin en 
file d'attente de revision. 

EXEMETEO, une version personnalisee de I'executeur GramR, prend le bulletin en charge, 
compte les mots, applique les grammaires de traduction, prend note du nombre de marques de revision 
gener^es par I'analyseur et place le bulletin en file d'attente de revision. 

SUPRVI2R, le moniteur, affiche en tout temps I'fiiai des files d'attente de traduction de revision 
et de transmission. S'il y a des bulletins en file d'attente de revision, le traducteur specifie le 
bulletin qu'il veut reviser. 

RfiVISEUR, un 6diteur specif iviuement congu pour la traduction automatique, permet au traduc- 
teur de reviser le bulletin en un minimum d'operations. II compte egalement le nombre de corrections 
ef fectuees, demande les initiales du reviseur, met le texte en format TELEX, prend note de I'heure de 
fin de revision et met le bulletin en file d'attente de transmission. 

II y a egalement urn* batterie d'utilitaires pour relancer automatiquement le systfeme apres une 
coupure de courant ou une panne, effectuer un diagnostic complet apres la relance, pour charger de 
nouvelles grammaires saris interruption du fonctionnement et fournir au chef de section des rapports 
de production et des statistiques de fonctionnement. 



Le materiel 

L'ordinateur utilise est un micro-multi-usagers de marque Cromemco centre sur un microproces- 
seur 68010. II es: dot6 d'un disque rigide de 5 Mo et d'une memoire centrale de 512 Ko. Une inter- 
face de communication serie multi-ports assure la liaison avec une ligne TELEX a 300 bauds 
du CN/CP et un terminal intelligent servant de poste de revision. 

Le systeme d'exploitation est une variante d'UNIX appelee CROMJX. 

Le systeme a ete choisi pour sa performance et sa fiabilite. Le temps de panne est presen- 
tement inferieur k une joumee par an et un second ordinateur est pr6t a prendre la releve en cas de 
besoin. La plus longue interruption de service i ce jour est due, ironie du sort, ^ la meteo. Le 
service de traduction a ete interrompu pendant 64 heures consecutives i la suite du violent orage qui 
a frappe Montreal le 14 juillet 1987. 



IMPLANTATION DU SYST^ME DE TRADUCTION ASSISTEE PAR ORDINATEUR (TAO)^ 

Moise Levy 
Bureau des traductions 
Secretariat d'Etat du Canada 



Ce printemps, le secteur Langues officielles et traduction du Secrcta..ai d'etat lan9ait i Mon- 
tr6a? un projet de traduction assistee par ordinateur. Ce projet devant se derouler en milieu de 
travail, c'est la section Informatique qui a ete choisie pour des raisons i la fois strategiques et 
J^chniques. En effet, le volume de la demande dans cette speciaiite ainsi que le bassin de connais- 
sances techniques acquises dans cette section semblaient justifier le choix du ministere. 

Uncalendrier d'implantation et de mise en oeuvre, couvrant la periode d'essai initiale d'un an, a 
6te etabli d'un commun accord entre les representants du Secretariat d'Etat et ceux de la societe 
Logos, dont nous allions utiliser le systeme. 

L'6quipe de traduction affectee ^ ce projet avait pour tSche d'enrichir la base de donnees ter- 
minologiques du systeme, d'elaborer des methodes de travail susceptibles d'en accroitre Teff icacite et 
d'examiner les qualit^s ergonomiques de ce nouvel outil de travail. Elle devait, en outre, evaluer la 
performance du systeme en fonction de trois versions successives du logiciel de traduction. 
Phases du projet 

Dans Tensemble, le projet devait comporter ^uatre phases distinctes : le choix et la formation du 
personnel, Tadaptation du personnel au systeme, la production et enfin, revaluation. 

1. Choix et formation du personnel : dans un milieu de travail hautenr.ent technologique, nous 
ne pouvions choisir que des traducteurs reconnus pour leur competence professionnelle et 
leur autonomie en milieu de travail. De plus, il fallait choisir parmi ceux que la presence 
d'un ordinateur dans nos locaux n'effrayait pas. Trois traducteurs de la section Informa- 
tique ont ete choisis pour suivre des cours d'introduction ^ I'equipement et au traitement 
de texte Wang ainsi qu'au systime Logos. Trois autres traducteurs, travaillant pour la 
societe Logos, sont venus se joindre ^ I'^quipe. 

2. Adaptation du personnel au systeme : la dur6e d'apprentissage et de familiarisation aux 
differentes fonctions du systeme a 6te evaluee t environ un mois. Pendant cette periode, 
les traducteurs ont effectue la traduction de textes d'exercices et d'un corpus de reference 
compose de 200 phrases-type extraites des fextes de nos principaux clients, ont enrichi le 
dictionnaire et ont etabli une liste de recommandations destinees au personnel charge de 
developper le systeme. 

Des le d6but, il a fallu se doter d'une methode et d'outils mieux adaptes aux besoins parti- 
culiers du Bureau. 

3- La produi.. [on : pour mieux mesurer I'adaptabilite du systeme a notre speciaiite, nous avons 
decide d'offrir un service efficace a la clientele. Ainsi, tout en essayant d'enrichir et 
d'ameliorer le systeme, nous devions nous efforcer de le rendre rentable en milieu de 
travail. 



^Communication pritentie lort de la Deuxi^me Conference des chefs d*£tat et de Gouvemen ent de pays ayant en 
commun I'usage du fran^ais, sous le th^me : Industries de la langue, Quebec, 5 septembre 1987« 
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4. devaluation : outre revaluation du systeme comme outil de traduction, appele i evoluer 
par rintroduction de trois versions successives du logiciel, il fallait egalement juger son 
efficacite sur le plan de la production, de la qualite des textes produits et des aspects 
ergonomiques qui le caracterisaient. 



Choix des textes 

Pour le moment, les textes destines k Sire traduits par ordinateur doivent repondre h certains 
criteres de base : textes volumineux, comme les guides et manuels d'exploitation ou de formation; 
textes suivis ne comportant pas beaucoup de tableaux, de colonnes ou de chiffres; textes ayant des 
parties repetitives ou se recoupant d'un chapitre ou d'un volume k Tautre; textes dont la redaction se 
prete a une assimilation plus directe par la machine. 

La rentabilite du systeme repose en partie sur la reception du texte de depart sous forme «ordi- 
no!ogique» (sur disquette ou par telecommunications) afin d'en eviter !a saisie manuelle. Un serieux 
effort d'information a done ete entrepris aupres des services ministeriels de traduction afin qu'ils 
renseignent les clients sur Timportance de remettre les disqueltes du texte de depart, et si possible 
des disquettes d'un format acceptable. 

La traduction assistee par ordinateur exige du traducteur qu'il franchisse plusieurs etapes pre- 
cises et de duree variable salon la nature et le degre de technicite du texte de depart. Avant de 
soumettre un texte k la traduction, 11 doit etablir un plan de travail au terme duquel il aura reconnu 
les principales difficultes que le systeme Logos devra resoudre, en mfime temps qu'il aura determine 
les domaines specialises k specifier au systeme. Cest Ik une tSche primordiale car la qualite des 
resultats obtenus depend en grande partie des «codes de ministere» et des «codes de domaines» que le 
dictionnaire .ra consulter en priorite, avant de tous les passer en revue, le cas echeant. Le traduc- 
teur procede ensuite k une pre-edition du texte de depart afin d'eliminer toutes sortes d'erreurs 
comme les fautes d*orthographe ou les sigles errones, erreurs qu'il ira corriger dans le texte de 
depart. La pre-edition permet done d'alleger et dViccelerer les tSches ulterieures. 

Le traducteur entreprend ensuite deux tSches successives : la recherche, par le systeme, des 
termes nouveaux (New Word Search) et la determination, par le systeme, de la frequence des expres- 
sions nominales (Noun Phrase Search), chacun^ de ccs tSches etant elle-mSme suivie d'une seance 
d'enrichissement du dictionnaire (fonction ALEX). Cest a ce stade que le systeme devient interactif 
et que Tintervention du traducteur devient indi!ipens?.ble. En fonction des resultats recherches, le 
traducteur doit donner une serie de precisions grammaticales ou syntaxiques au sujet de chaque 
nouveau terme ou de chaque expression nouvelle qu'il introduit dans le systeme. 

Apres une analyse des resultats, h Tissue de la premiere boucle ou serie de tSches, le traducteur 
peut recommencer le mSme processus pour s'assurer qu'il a pleinement utilise les ressources du syste- 
me. II peut aussi rediger de nouvelles regies semantiques (fonction SEMANTHA^ qui permettent au 
systeme de traduction de considertr le contexte semantique et syntaxique et de choisir un transfert 
plus indique pcur un mot ou une locution dans la langue de depart. Les regies semantiques permet- 
tent d'identifier les contextes dans lesquels les tranferts de la base du dictionnaire seraient mala- 
droits ou inappropries et remplacent ces transferts par des constructions qui dcnnent une signification 
plus exacte dans la langue d'arrivee. Le traducteur doit enfin proceder k la post-edition du texte en 
vue de la livraison au client. 

Un grand nombre de tdches se deroulant en arriere-plan, le traducteur doit modifier ses metho- 
des de travail et s'adapter au nouvel outil qui lui est offert. Tres souvent, il passera la plus grande 
partie de ses heures de travail a accomplir des tSches d'anal>se, de refuimatage, de pre-edition et 
d'enrichissement du dictionnaire et n'entreprendra sa traduction qu'en fin de journee, la traduction ne 
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sera prfite que le lendemain. Cest t ce moment qu'il pourra analyser les resultais et proceder ^ la 
post-edition de son texte. L'interface homme- machine est done un element indispensable de la tra- 
duction assistee par ordinateur. 

Par consequent, nous sommes confrontes k un changement radical du travail. Le rdle du traduc- 
teur se trouve totalement bouleverse. Non seulement doit-il s'eloigner du schema traditionnel de la 
traduction - assimilation, conversion et redaction - mais encore doit-U changer sor rythme de travail 
pour s'adapter au fonctionnement et aux exigences de la machine. Certaines operations lui apparais- 
sent lourdes et encombrantes alors que d'autres, le transfer! par exemple, ne lui imposent plus cette 
fatigue mentale, grande generatrice de stress, qui caracterise la profession de trvtducteur. 

Au stade de la post-edition, les nouvelles fonctions du traducteur ressemblent davantage celles 
du riviseur traditionnel. Desormais, le traducteur doit s'ef forcer de corriger sur les sorties- machine 
ce qu'il n'a pu trouver ni introduire dans le programme de traduction. 

Nous pouvons, d'ores et deji, imaginer qui sera le traducteur de demain. Devant un appareil de 
pos^-edition hautement perfectionne qui lui permettra d'accomplir toutes les taches preparatoires, il 
pourra aussi consulter simultan6ment le texte de depart et le texte d'arrivee, et acceder aux bases de 
donnees d'un dictionnaire 6Iectronique comme Termlum III. II n'aura plus ^ inanipuler du papier ni ^ 
consulter constamment les volumineux dictionnaires et encyclopedies qui ont, jusque-I^l, constitue les 
piliers indispensables de sa profession. 
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LA BANQUE DE TERMINOLOGIE DU QUEBEC: 
UN INSTRUMENT DE DfeVELOPPEMENT SOCIAL, 
AU CARREFOUR DES ENJEUX TECHNOLOGIQUES ET LINGUISTIQUES^ 



Jean-Marie Fortin 
Directeur des productions Hnguistiques et terminologiques 
Office de la langue frangaise 



La Banque de terminologie du Quebec : un instrument de d^veloppement social, au carrtf our des 
enjeux techneloglques et Hnguistiques, voili un titre evocateur des no.abreuses transformations 
sociales qu'a connues le Quebec au cours des deux dernieres decennies, notamment i la faveur des 
legislations Hnguistiques. Titre tout aussi ivocateur des changements technologiques que les divers 
agents de la society sont en train de r6aliser et qui bouleverseront le fonctionnement de nos vies au 
travail, & T^cole et k la maison, 

Cest done en tant que t6moin de Tusage et agent de changement que la Banque de terminologi** 
du Quibec, qu'on appelle aussi de fagon plus familiere la «BTQ>^, vous est presentee aujourd'hu.. 



Le cadre historique de la situation linguistique 

Auparavant, il est necessaire de se pencher su- revolution historique du Quebec, da. - ce qu''* a 
de plus significatif, sur le plan linguistique. Les vingt-cinq dernieres annees ont ete marquees dans 
tout le monde occidental par une extension phcnom6naIe de la capacite d'intervention de Tfetat dans 
divers secteurs de Tactivii^ humaine. Les nonibreuses manifestations de la reglementation sociale 
que TEtat prescrit visent habituellement k amener «Ies di verses composantes de la socicte i assumer 
des taches et des responsabilites qui ne leur sont pas dictees par les incitations normales du marche;> 
(Allaire et Miller 1980:5), que ce soit sur le plan de la protection du consommateur, sur le plan de 
Tenvironnement ou de la s6curit6 au travail. Les questions Hnguistiques n'ont pas echappe a cette 
tendance. En Norvege, en Turquie, en Israel, au Canada et au Quebec, et bien d'autres endroits 
vHCore, TEtat est intervenu pour etablir Tequilibre souhaite par la population dont la conscience 
linguistique n'a jamais 6te aussi aigQe qu'en cette seconde moitie du XX' siecle. «La langue peut 
done jouer un r61e mobilisateur extrSmement puissant dans Tintegration ou la desintegrar.ion des 
soci6t6s» (Martin 1983;10), ainsi que nous Tavons vecu au Quebec et au Canada au cours des deux 
derniferes decennies. 



La situ2^:ion linguistique quebecoise a ceci de particulier, qu*on a voulu, a la faveur des 
legislations Hnguistiques successives, corriger rapidement une situation qui resultait de Tindus- 
trialisation qui s*est faite en anglais au XIX* siecle et dans la premiere moitie du XX* si6cle, tout en 
continuant t progresser dans les diverses manifestations industri<.iies, economiques et sociales. 



^Communlc&tion pr^sent^e Ion de la Deuxume Conference des chefs d'Etat et de Gouvemement de pays a>ant en 
commun {'usage du fran^ais, sous le th^me : Industries de la lan6:ue, Quebec, 5 septembre 1987. 
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Lu BTQ : un instrument de d6veloppement social 

Sur le plan de la langue elle-mSme, il a done fallu faire un rattrapage historique blen particulier 
au Quebec^ compte lenu de la situation dans les autres pays de la francophonie, ou la lerminologie 
traditionnelle c«es domaines d'activites industrielles et economiques etait connue et utiliscc, tandls 
qu'au Quebec Tanglais domin?U dans la plupart des secteurs d'activite. II fallait done trouvcr le 
moyen de substituer les termes techniques fran9ais aux termes techniques anglais en usage principa- 
lement dans le milieu des entreprise*^ et des affaires. Pour faire cette substitution, il fallait que Ie,s 
ressources terminologiques soient disponibles et facilement accessible;. La Banque de termino- 
logle est done n6e de la necessite. Elle a et(^ criee en 1973 au coeur m^jme du debat linguistique. En 
raison de la situation linguistique partieulicre du Quebec par rapport au reste de la francophonie, il a 
fallu dans un premier tp>nps proceder k dej inventuires terminologiques dans le but de faire la 
preuve de r^xistence de terminologies frangaises de qualite, aptes a exprimer les r^alites industrielles 
et economiques modernes et dans un deuxieme temps, identifier les lacune^ existnntes dans Jes domai- 
nes techniques afin d'enclencher une production terminologique motivee -^ar la derv^ande, qu'elie soit 
ponctuelle ou sectorielle, dans les domaines ou il n'y a p^s de reponse satisfaisante. Ainsi, TOffice 
de la langue frangaise a con?u sa Banque de terminologle comme un systeme et un procv^de de gcstion 
des terminologies, tani sous I'aspect production que diffusion, dont on aura remarque la complemen- 
tarite evidente. 

Les inventaires et les productions terminologiques dans les secteurs traditionnels constituent ce 
Qu'il convient d'appeler une operation de ratt^'anaae. Le r^-ui*^>* nt^tta nf>irof;/\n o tya^w^ir An. 
les bases d'un systeme dMnformation terminologique qui contient approximativem.enl aujourd'nui, 
d'une part 852 000 fiches portant sur enviton 3 500 000 termes, temoins de la r.chesse du frangais et 
repr6sentant les 37 secteurs d'activite economique du Quebec, et d'autre part environ 41 000 refe- 
rences de repertoires terminologiques contenant du frangais. 

La diffusion massive d'une banque de terminologie comme la BTQ a un «r61e important a jouer 
dans la normalisation sociale des terminoIogie?;>N (Auger [1960]:3G). Aussi avons-nous pense a struc- 
turer sa diffusion dans une gamme de produits et de services en fouctlon des besoins du n.arche et en 
interaction avec k demande. Ainsi I'Office de la langue frangaise offre-t-ll i la population, gr^ce a 
sa Banque de terminologie, les produits et les services suivants : 

1- I'acces direct par ir-rde terminal; 

2- I'acces en differe par des listages; 

3- des consultations ponctuelles par telephone; 

4- des publications qui prennent la forme de repertoirer, bilingues ou de bibliographies, 

5- et bientdt des minibanques personnaiisees et constitutes mesure par un tele- 
chargement selectif. Ces minibanques peuvent etre exploltecs en mode autonome sur »Tilni 
ou micro-ordinateurs. 

Les 3 500 000 termes que contient la memoirp de la BTQ concretlsent et harmonisent Texpreb- 
sion des rapports qui s'etablissent dans la societe, sur le plan social, industriel et economique, 

«l 'homogeneite des reponses que sa diffusion permel a travers un rese^ o\en developpe et 
diversifie «par une gamme de produits et de services appfoprIes» aura en termer d'annees un $ffet 
d'uniformisation tres important sur les terminologies en usage au Quebec» (Auger [1968].30j. 

Et c'est principalement dans ies comm?jnications institutionnalisees que Tapporl de la BTQ aura 
ete le plus tangible 

Par «communication inst' utionnalisee», il faut entendre, ainsi que le definit M. Jean-Claude 
Corbeil dans L'amenasement linguistique du Quebec (Corbeil 1975:79) : 
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«L'&cte, le plus souvent &nonyme ou impenonnel* par lequel une institution entre en 
relation avec dts personnes, soit en tant que membres de cette institution, soit dans la 
relation employeur* employ^, ou encore en quality de clients, d'auditeurs ou de specta- 
teurs». 

Ainsi que le demontren: les rapports de gestion du reseau des abonnes de ia BTQ, les maisons 
d'enseignement, radmlnlstratlon publique et les entreprlses representent plus de 97% des clients du 
systeme en acces direct. lis consomment 98% du temps d'Interrogation et lis font 99% des transac- 
tions dans le systeme sous forme de commandes. 

Cette repartition de la consommat.'on de Tinformation terminologique a des incidences directes 
sur la qualite et la quantite des termes techniques utilises dans la langue de Tenseignement des 

— -A J ^^C f.^- — : — - « — j^. J * .u_!«.... "r> n- J 
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publique, Tinformation terminologique agit de la meme fa?on sur la langue dans laquelle sont redlges 
les lols, les reglements, les formulaires et la documentation i Tusage des citi yens. Enfin, dans les 
entreprlses, rutilisation de Tinformation terminologique permet d'assurer 1 1 frangais la gestion 
interne, d'exprimer et de reallser des choix technologiques, d'assurer en frangals des relations a\ec la 
clientele par I'etiquetage, les modes d'emploi des produits, les garanties, etc. 

Est-Il besoin de dire que les initiatives de TOffice de la langue frangalse, en ce qui a trait a la 
Banque de terminologie, s'inscrivent dans la demarche de Tappllcatlon d'une politique llngulstlque qui 
constitue «rensemble des choix conscients effectues dans les rapports entre langue et vie soclale et 
plus partlculierement entre langue et vie nationale» (Calvet 1967.155). Ces Initiatives sont des exem- 
pies de la mise en oeuvrc des moyens necessalres a Tapplicatlon d*une politique llngulstlque, mo>ens 
dont Tensemblc constitue ce qu'on appelle la planlfication llngulstlque qui s*exprime en deux volets, 
soit par des programmes d'actlon sur la langue (dont la terminologle est une des composantes essen- 
tielles), soit par des programmes d'action visant les rapports entre les langues. 



Les enjeux technologiques et linguistiques 

Ainsi que Texprlme M. Leon Dion, dans UEtai et la planification lin^uistique : «Les langues, 
dans les socletes industrlelles avancees, en tant que vehlcules de communication, contlnuent a etre 
etroitement associees a la technologle ... en determinant de fa?on plus directe que dans le passe les 
rdles soclaux les plus prestigleux.» (Dion 1981.22). Au Quebec, Temergence des nouvelles preoccu- 
pations soclales a ete suivie d'un developpement sans precedent de la icchnoiogle. Et pour exprimer 
le developpement de la technologle, de nouveaux termes dolvent etre .,es quotldiennemeat. 

La Banque de terminologie du Quebec doit dor.c evoluer au meir.e rythme que les actlvltes llees 
au marche des 37 secteurs d'actlvlte economlque du Quebec. Le deplolement de nouvelle:> technolo- 
gies, en partlculier celles qui sont liees aux biotechnologies, aux techniques informatlques et a la 
microelectronique, fait qu*Il existe p^u de metiers et de profession^ qui ne solent presentement Tobjet 
d'un questlonnement d*ordre technologique, affectant dans Tlmmedlat la terminology en usage. Un 
bon nombre de ces professions ont une duree d. •le blen comptee, d'autres sont en plelne transfor- 
mation ou en pleln^ emcigence, notamment dans le secteur d'actlvltes qui nous touche de pres, nous, 
terminologues, traducteurs, celul des Industries de la langue qui, Incldemment, evolue sous rimpulsion 
d'ingenieurs-cognitlciens. A Theure actuelle, des pans entlers du ^avolr sont en trai.i de se renou- 
veler. Qu'on pense seulement k Telectronlque qui, malgre ses origlnes diverses. etalt dotee au debut 
du siecle d'un vocabulaire blen frangals jusqu'^ la revolution microelectronique dont temol- 
gne rinvention du transisto% en 1948, dans les laboratoires Bell. Par la suite, ce fut la 
course effrenee : invention du circuit Integre en 1958 par Fairchild et Texas Instrument, 
le microprocesseur en 1971 par Intel, et voIlS qu'apres les tubes et les seml-conducteurs T American 
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Physical Society annonce la possibilite de fabriquer des supra-conducteurs qui fonctionnent a la 
temperature ambiante (Pharand 1987:5). Cest la troisieme revolution de la microelectronique qui se 
profile i Thorizon. 

A I'heure actuelle, la microelectronique est con?ue et libellee en anglais. Phenomene sans 
consequence, pensez-vous! Apres tout, elles ne sont pas si nombreuses les entreprises qui fabriquent 
des composantes electroniques au Quebec Mais quelles sont les entreprises aujourd'hui qui ne font 
pas appel k la microelectronique k une etape ou k une autre du processus de production? Selon le • 
president du Conseil de rindustrie electronique du Quebec, M. Pierre Pharand, «toutes les entrepri- 
ses, meme les toutes petites, y font appel et I'experience nous montre que, dans ce domaine, la 
langue utilisee est d'abord ranglais» (Pharand 1987:5). , 

L^evolution de la microelectronique es* veritable epop6e qui propulse revolution scienji^e 
dans le domaine de Taerospatial et a d jmbees techniques da^is la vie de t'ou^Me^^fefers par 
Tutilisation d*une panoplie de dispositifs electroniques. •"^ ♦> ' ' 

f 

L^exemple que nous venons de donner n*est pas unique; il pourraif etre le modele descriptif de 
ce qui arrive avec les biotechnologies et les techniques informatiques qui se repercutent dans la 
plupart des secteurs d'activiies, que ce soit dans I'industrie automobile, I'imprimerie, Tedition ou 
encore dans Tun ou Tautre domaine du secteur tertiaire, par exemple dans les services financiers et 
bancaires. 

Celaaffecte considerablement le volume des terminologies k mettre k jour et leur duree de vie 
Au cours de Tannee 1986-1987, les terminologues de rOffice ont fait 152 000 mises a jour dans le 
systeme BTQ, soit par Tajout de 36 200 nouvelles fiches, soit par la modification ou par la suppres- 
sion de 115 700 fiches. La mise k jour a done touche 18% du contenu de la banque. 



Les horizons du d^veloppement de la BTQ 

^ En terminologie, les problemes sont rarement regies une fois pour toutes. II faut verifier 
periodiquement les equivalences des termes, verifier et adapter leur definition, verifier les series 
synonymiques, etc. Cela temoigne dans une certaine mesure de la sante et de la vitalite de la 
langue. 

Si nous nous tournons vers Tavenii et que nous nous demandons maintenant comment nous 
pourrions parcourir le chemin qu*il reste k faire, il est clair que ce que nous venoms de dire con- 
ditionne la nature et la portee de nos priorites en matiere de gestion de Tinformation terminologique 
pour les prochaines annees. 

II faut de toute urgence et de fa?on concertee avec nos partenaires (les entreprises, Tadminis- 
tration publique, le reseau de I'enseignement) : 



1 - Orienter le systeme BTQ de production terminologique vers les sciences et les tech- 

nologies porteuses de Tinnovation industrielle, et au premier chef les biotechnologies, les 
techniques informatiques, la microelectronique, et engager une production massive. 

2 - S'appliquer k renouveler les vocabulaires traditionnels en fonction du leadership qu'exer- 

cent les nouvelles technologies sur les metiers et les professions, a la fois dans les secteurs 
industriels et dans les services. 



ERIC 



Des lors, une question se pose : comment peut-on s'organiser efficacement pour que la Banque 
de tersninologie du Quebec constitue une valeur sOre dansdixans? Comment doit-on s'orga- 
niser poursuivre revolution de 3 000 000 k 4 000 000 de termes tout en ajoutant quelques dizaines 
de millieis de termes par anneo pour denommer les inventions nouvelles? 



A. 
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Le temps manque aujourd'hui pour couvrir de fa^on exhaustive tous les aspects de la question, et 
surtout le volet des techniques informatiques. 

Je voudrais tout simplement dire et repeter qu'^ mon avis la solution se trouve dans un traite- 
ment intelligent de la langue naturelle en empruntant a Tintelligence artificielle et aux systemts- 
experts la combinatoire requise pour mettre au point un systeme d'aide aia recherche terminologique, 
et principalement pour le depouillement automatique des textes techniques. Cela constitue notre 
troisi^me priorite. Elle est rendue necessaire pour realiser efficjcement les deux premieres. 

Le Quebec beneficie d'une bonne expertise en la matiere et les bases du systeme existent. 
CommeTexprime Richard Parent, du Bureau central de I'informatique au gouvernement du Quebec, il 
s'agit de poursuivre «la recherche en Tactualisant dans les projets-pilotes (a des fins terminologiques) 
... La partie systeme -expert a ete developpee ... une batterie de structures de donnees, divers mode- 
les d'exploration. des series d'automates. d'operations. de fonctions., le Kont egalement ... , (nous 
avons de plus) Tanalyseur lexico-syntaxique du frangais qui contient beaucoup de donnee:> et de 
connaissances sur la langue fran?aise ... De nouveaux efforts doivent done etre consentis, notam- 
ment pour la construction d'uA module de traitement linguistique ...>> (Parent 1 5) A court terme, une 
collaboration pourrait 6tre envisagee avec TUniversite, le Bureau ^entral de Tinformatlque et TOffice 
et il est per mis d'envisager des resultats concrets des 1990. 

Le Quebec a acquis une nouvelle maturite, une nouvelle securite, une nouvelle conf lance dans 
son de veloppement linguistique, de sorte que «rOffice de langue fran^aise peut se preoccuper surtout 
(aravenir) de prevention et de promotion, de concer' ^vec ses partenaires» (Laporte 1987:19). Cest 
ainsi ques'exprimait le president de TCffice, M. Laporte, dans la conference qu'il pronon^ait dans ce 
meme Carrefour. 

Cest egalement en pensant a cette fa?on d'entrevoir Tavenir que Ton peut affirmer 
que le Quebec a besoin d'un systeme de production et de diffusion terminologiques i la fine pointe de 
Tactualite, defi que TOffice et sa Banque de terminologie devront relever pour assurer le rayon- 
nement de la langue fran?aise dans toates les spheres d'acti*. ite economique du Quebec, aux horizons 
de ran 2000. 
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Dans un pays bilingue et multiculturcl cciriirie le Canautt, il ne faut pas se suipicuuic u;; vuli uu 
nombre considerable de gens s'interesser aux industries de la langue. II s'agit d'un secteur dans 
lequel les Canadiens possedent des competences reconnues et ont accompli de nombreuses realisations. 
Les deux grands grcupes linguistiques du pays se sont donne des outils efficaces de communication. 

Canada n'aurait sans doute pas pu atteindre le degre de cohesion que nous observons aujourd'hui 
sans la presence, constante et dynamique, de milliers de personnes engagees dans la promotion de la 
communication dans le*v deux langues officielles du pays. 



Role du Secretariat d'Etat en mati^re linguistique 

Le Secretariat d'Etat du Canada joue un rile important dans le processus de transmission de la 
communication entre les communautes anglophc e et francophone du pays. Un des grands mandats qui 
ont ete confies t ce ministere consiste precisement t favoriser, par divers programmes et activites, 
Tepanouissement, dans sa langue, de chacun des deux groupes linguistiques. Ce mandat decoule de 
Tadoption, en 1969, de la L n sur les langues officielles qui gv^rantit a tout citoyen canadien Tacces 
aux service?; gouvernementa^x dans la langue officielle de son choix. De plus, tous les documents qui 
sont /endus publics par l*administration federale doivent etre publics en frangaia et en anglais. Dc 
telles dispositions de la Loi obligent Tadministration k se doter de services de soutien linguistique 
importants. Le secteu Langues officielles et tradu^-rtion du Secretariat d^Etat constitue le centre 
nevralgique sur lequel s'appuie le gouvernement canadien pour mettre en oeuvre sa politique linguis- 
tique. 



Le Bureau des traductions 



Cree par une loi du Parlement en 1934, le Bureau des traductions du Secretariat d*Etat dessert 
rensemble de Tappareil administratif federal. II fournit des services de traduction, u interpretation et 
de terminologie, ainsi que des services linguistiques aux ministre^, deputes, senateurs et aux quelques 
260 000 fonctionnaires de tous les ministeres et organismes qui en dependent. Si les services de 
traduction et d'interpretation ne sont destines qu'a la fonction publique, il en va autrement pour la 
recherche terminologique et les conseils linguistiques qui rejoignent quant k eux Tentreprise prlvee et 
le grand public. L*ampleur de la t&che i accomplir a incite le gouvernement canadien a mettre en 
place une infrastructure capable de repondre & la demande croissante de se^'vices linguistiques, en plus 
de se doter d'outils k la fine pointe du progres. 



^Communication pr^senWe low de la Deuxi^me Conference des chefs d'£tat et de Gouvernement de pays ay a at ea 
commun I'usage du fran^ais, sous le th^me : Industries de la langue, Quebec, 5 septembre 1987. 
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La banque de donates linguistiques Tertnium 

Parmi les outils mode- les destines t faciliter la communication au sein d'une societe bilingue et 
multiculturelle, U y a la Banque de donnees linguistiques du gouvernement canadien, connue sous le 
nom de Termium. Mise au point par une equipe de chercheurs de I'universite de Montreal au debut 
des annees 1970, puis prise en charge par le Secretariat d'Etat en 1975, la banque Termium renferme 
aujourd hui pres de 900 000 fiches. Maintenant dotee d'un logiciel de troisieme generation el' - a 
subi de nombreuses transformations depuis son acquisition par le Bureau des traductions. Aux 150 000 
fiches de depart sont venues s'ajouter des centaines de millic.-s d'autres fiches recueillies aupr6s de 
1 ensemble des traducteurs de I'administration federale et de plusieurs universites du pays ainsi qu'au 
sein des services hnguistiques de grandes entreprises canadiennes. Depuis plus de dix ans une impor- 
tante equipe de terminologues s'affaire k mettre de I'ordre dans toutes ces donnees, en plus de verser 
reguherementdans Termium les nouveautes terminologiques rencontrees au gre de travaux de recher- 
ches ponctuelles et thematiques. 

Destinee d'abord a repondre aux besoins d'un nombre considerable de traducteurs au service de 
lEtat, qu'ils soient fonctionnaires, pigistes ou entrepreneurs, la banque Termium est composee de 
quatre grandes bases de donnees particuHerement bien adaptees aux besoins de cette clientele II 
sagit de hhzsQ Appellations qui renferme plus de 75 000 titres; de la base Multilingue qui contient 
plus de 33 000 fiches et ou I'allemand et I'espagnol cdtoient le fran?ais et I'anglais: de la base Ter- 
mmologie, riche de plus de 775 000 fiches redigees en anglais et en fran?ais et de la base Difficultes 
de traduction, off rant environ 10 000 solutions 4 autant de problemes que peut rencontrer le traduc- 
teur. A peu pres tous les domaines de la connaissance sont couverts, dans des proportions varices 
par cette masse colossale de donnees linguistiques. Cette derniere caracteristique est sans doute celle 
qui a le plus contribue k etendre la diffusion de Termium auprfes d'individus, d'entreprlses et d'orga- 
nisations voues k la promotion de la communication tant en fran?ais qu'en anglais Le reseau Ter- 
mium, qui compte presentement 288 terminaux, dont 27 a I'etranger, pour un total d'environ 3 000 
utihsateurs, est »oin d'avoir atteint son potentiel maximal de diffus-on. Des contraintes financieres et 
techniques nous ont empfiche jusqu'i maintenant d'etendre davantage son rayonnement. Cette situa- 
tion est cependant appelee k changer grSce, prlncipalement, aux progres technologiques et a I'lmmense 
potentiel de Termium. 



Situation privilegi6e du Canada 

Le Canada, en tant que pays bilingue, a le bonheur d'appartenir a deux grandes corr^munautes 
linguistiques Internationales, celles de la langue anglaise et de la langue fran?aise. En fait 11 y a 
peu de pays bilingues qui possedent cet atout. Grandes langues de communication, le fran?ais et 
1 anglais possedent un statut des plus enviables. Cet.e particularite du tissu linguistique canadien a 
permis au Canada, depuis quelques decennies surtout, de jouer u.. rdle de premier plan dans des 
domaines tels que la traduction automatique et la constitution de banques de terminologie informati- 
sees. Ce n'est done pas un hasard si le Canada possede le seul systeme d'? traduction completement 
automatique ^e haute qualite, le systeme METEO, mis au point par I'equipe TAUM de I'universite 
de Montreal, ainsi que deux des cinq grandes banques de terminologie qui existent dans le monde 
occidental, soit la Banque de terminologie du Qu6bec et Termium. Ces outi.'", modernes de commu- 
nication, mis au service ? deux grandes langues largement repandues su." la pianete, ont permis au 
Canada d'etablir de multiples relations avec une foule d'organismes internaiionaux et de mettre ainsi 
en evidence son savoir-faire dans le domaine des technologies de pointe appliquees aux Industries de 
la langue. 



Termium au service de la promotion des langues officielles 



Devenu, au fil des annees, un outil de communication . xhange international, Termium n'a 
pas pour autant atteint son plein epanouissement national. 61e qui lui est devolu, celul de pro- 
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mouvoir le bon usage des langues oiTIdelles au Canada, reste encore & dtre developpe. Certaines 
ccntraintes, principalement f inancieres, ont oblige le Bureau a f reiner Texpansion du reseau Termium. 
Cette situation pourrait bien changer du lOut au tout grice aux progres recents de la technologie, 
principalement en ce qui concerne la mise au point du disque optique numerique ou CD-ROM. Les 
gros systfemes informatiques ont des limites quant au nombre d'utilisateurs qu'ils peuvent desservir 
simultanement. En plus d'etre coQteux, autant ^ Tachat qu'^ Tentretien, ces systemes ont parfois du 
mal a s'adapter a la dispersion geographique de leurs utilisateurs. 

Lr presence de six fuwoaux horaires au Canada est un des facteurs qui militent en faveur de 
Tacces k Termium par d'autres moyens que Tinterrogation en direct de Tordinateur, qui se trouve 
dans la region d'Ottawa-Hull. D'autres facteurs plus importants, tels que la limite de puissance du 
systeme et le nombre restreint d'utilisateurs capables d'interroger simultanement Termium, incitent le 
gouvernement canadien k explorer de nouvelles avenues afin de rendre disponible a un plus grand 
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La technologie du disque optique, pour ne citer que celle-l&, a dev£.nt elle un avenir promettcur. 
De nombreux secteurs d'activite s'y interessent. Le stockage des donnees terminologiques semble 6tre 
de CCS domaines cu I'application do la technologie du disque compact est possible. Un pfojet- 
pilote a ete mis sur pied par le Secretariat d'Etat et consiste t offrir i un nombre limite d'utilisa- 
teurs du Bureau des traductions et du secteur prive un disque optique sur lequel se trouve tout le 
contenu de la banque Termium. II suffit de placer le disque dans un lecteur de disque optique relie ^ 
un micro-ordinateur pour avoir acces sur le champ aux quelque 900 000 fiches de Termium, soit 
environ deux millions de termes. Les tests, qui s'etendront sur plusieurs mois, vont nous permettre 
de savoir dans quelle mesure cette nouvelle technologie pourra servir h augmenter le nombre d*abon- 
nes k Termium. II y a tout lieu d'etre optimiste quant aux resultats de Inexperience en cours. 

II a ete mentionne, au debut de ce texte, le nombre de 288 terminaux qui constituent le reseau 
actuel de Termium, dont 261 sont installes au Canada, la majorite de ceux-ci se trouvant au Bureau 
des traductions du gouvernement canadien. Les traducteurs du Secretariat d'Etat, tout comme les 
terminologues, ont etabli une communication constante avec Termium. La communication entre les 
deux langues officielles dans la fonction publique canadienne passe souvent par Termium et ce, par 
traducteurs et terminol ^gues interposes. Comment ne pas envisager, grSce au disque optique, une plus 
grande diffusion de Termium au sein m^mo de la fonction publique, aupres des centaines de redac- 
teurs, correcteurs et autres fonctionnaires appeles t travailler regulierement dans les deux langues 
officielles de Tadministration federale? Comment ne pas songer egalement a un autre marche potentiel 
considerable et en pleine expansion, celui des classes d'immersion de langue frangaise qui jouissent 
d'une grande popularity un peu partout au Canada? A Theure de Tinforn^atique, eleves, etudiants et 
enseignants auraient tOt fait d'exploiter toutes les subtilites du logiclel Termium. II ne faut pas 
oubiier les centaines d'entreprises des secteurs des services et de Tindustrie qui sauraient trouver en 
Termium un outil moderne et efficace, propice & faciliter la communication tant en anglais qu'en 
frangais. Pourquci le grand public n'aurait-il pas acces eventuellement a Termium comme il peut deja 
avoir acces i certains services electroniques? Termium sur un Minitel canadien, pourquoi cela ne 
serait-il pas possible? C'est, k mon avis, dans cette optique qu'il faut envisager le role que doit 
jouer Termium dans la promotion des langues officielles au Canada. 



Termium, outil de communication international 

Le reseau international de Termium compte actuellement 27 points d' acces, situes essentiellement 
aux Etats-Unis et en Europe occidentale. D'importants centreb de services linguistiques americains et 
europeens ont vu Tinterdt qu*ils avaient i se relier a Termium a cause Ju contenu varie de ses bases 
de donness, de la qualite et de la quantite de ces donnees. Termium est devenue une mon- 
naie d'echange qui permet d'obtenir des abonnei> ^ Tetranger de precieuses donnees servant a mettre 
di jour les f ichiers. De plus, Termium contribue a mettre en place tout un reseau de collaborateurs et 
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d'interlocuteurs capables de comprendre, et mfime de defendre, les positions canadiennes dans les 
grands forums internationaux s'occupant des industries de la langue, principalemen.t en ce qui a trait 
^ la recherche terminologique. 

Plusieurs rencontres avec les representants des autres grandes banques de terminologie ont 
permis d'etablir certains mecanismes propices aux echanges de renseignements sur les travaux en 
cours dans les grands centres de terminologie, sur les difficultes rencontrees Ue part et d'autre et sur 
les moyens de collaborer plus etroitement k I'etablissement d'un veritable reseau international de 
banques de donnees terminologiques. 



Conclusion 

Un des grands avantages du developpement de I'informatique est precisement de faciliter le 
dialogue entre les peuples des divers continents. La rapidite avec laquelle se font maintenant les 
communications permet d'envisager I'etablissement de nombreux contacts partout a travers le monde. 
Termium, en tant qu'outil destind t faciliter le dialogue entre ies langues, entend participer pleinc- 
ment a I'essor technologique en cours afin d'offrir, au plus grand nombre possible de clients, tant au 
Canada qu'a I'etranger, les tresors linguistiques qu'elle renferme. Deji implante aux Etats-Unis et 
dans plusieurs pays d'Europe, le reseau international de Termium ne saurait 6tre complet sans la 
presence, en son sein, d'un certain nombre de pays africains. Deji, une premiere terminologique a 
ete reahsee dans le cadre du deuxieme sommet francophone par la publication de deux vocabulaires 
rediges en ikinyarwanda, en frangais et en anglais. Ces deux ouvrages portent sur I'industrie agro- 
alimentaire en Afrique. GrSce k la collaboration de I'Office de la langue francaise du Quebec et au 
soutien technique et financier du Secretariat d'Etat du Canada, le professeur rwandais Leon Mugesera, 
par I'entremise du Reseau international de neologie et de terminologie, peut maintenant offrir a ses 
compatriotes ainsi qu'i I'ensemble de la francophonie, le fruit de ses travaux terminologiques menes a 
runivei-sit6 Laval, ici-mSme k Quebec. Par ailleurs, il convient de signaler que le lancement de ces 
deux publications se fera aujourd'hui mfime, \ 18h30, t I'amphitheatre du manege militaire. II s'agit 
\k du resultat d'une heureuse collaboration Nord-Sud, collaboration que nous noas devons tous de 
promouvoir au plus haut point. 

I! y a sans doute bien des fafonj de faire progresser la communication et les echanges au sein 
de la francophonie international. Le Secretariat d'Etat du Canada, k I'exemple du rdle qu'il joue 
dans notre beau et grand pays, entend favoriser le rapprochement des peuples par des moyens tei:> 
que la diffusion de Termium et sa participation au Reseau international de neologie et de termino- 
logie. Mis au service de la communication, ces outils, si modestes soient-ils, n'en contribueront pas 
moins, nous I'esperons, k rendre plus harmonieux le grand dialogue des nations. 
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Au dctoui ues annees i950 et dans le sillage de la guerre finissante, o.i commenfa & percevoir 
racc6I6ration phenomenale du developpemen t de la technologie de Tinf ormatique et son insertion dans 
les ordres specialises du savoir. Quarante ans plus tard et a la veille de la conclusion du deuxieme 
millenaire de Phumanite, un quatuor de termes relies au mdme technolecte semble dominer Tunivers 
des connaissances et temoigne de Timpact de Tinformatique sur les societes. II s*agit des termes 
ordinateur (1955) (Marcellesi, 1979:176-180) et de son rejeton micro-ordinateur (1971), in f ormatique 
(1962) et de son satellite immediat micro-inf ormatique (vers 1980), logiciel (vers 1 970) et de Tadjectif 
artificiel Que Ton trouve associe k quelques substantif? (ex. intelligence, langage). A sa maniere, 
chacun a domine sa decennie et il est indeniable quMls font desormais ^artie integrante de Thistolre 
du fran^ais; k double titre d*ailleurs : premierement parce quMls sont devenus des termes techniques 
indispensables, deuxiemement parce qu'ils se sont coules dans le moule de Tusage general. 

Bien entendu, il est d*abord fait reference ici k la macro-informatique souvent denommee mf or- 
matique professionnelle. Les mutations technologiques successives ont pris une ampleur nouvelle au 
commencement des annees 1980 avec Tavenement de la micro-informatique qui a rendu materiels et 
logiciels disponiblea et accessibles pour toutes les categories d*usagers, specialistes ou profanes. La 
micro-informatisation entraina a sa suite une amorce de demystificatlon de la technologie et le debut 
de la banalisation de la terminologie propre au secteur. Une bonne partie du vocabulaire de Tinfor- 
matique n*est plus I'apanage exclusif des informaticiens, des penseurs, des concepteurs, des publici- 
taires, des diffuseurs et des vendeurs de produits. L*aggiornamento informatique trouve son acheve- 
ment dans les dictionnaires ue langue pour adultes ou pour eleves. Ainsi la nouvelle edition du 
Micro-Robert qui sera mise en marche tres bient6t, repertorie tout le vocabulaire de Tinformatique 
passedansTusagecommun. Onenfaitmdme un argument publicitaire. La visibilitedeTinfoi matique 
dans les foyers oblige les responsables k se pencher sur la «dejargonisation» du lexique. En parti- 
culier, il faudr' atopsier le statut de Tanglais comme langue vehiculaire de la technologie micro- ou 
macro-informc*tique. 

Les quelques problemes qui paraissent jouer un r6Ie majeur dans les rapports entre les concepts 
d'«informatique» et de «francophonie» seront abordes ci-apres. La position adoptee 1^,1 est celle du 
linguiste, qui use k Toccasion des outils informatiques, surtout de la micro, et qui a des preoccupa- 
tions en ce qui concerne les capacites d*une langue de faire f^^e au renouvellement de son fonds par 
le recours aux formes autochtones inedites ou existantes. 

A travers les siecles, le fran?ais a toujours su nationaliser les terminologies qui le necessitaient. 
Pourquoi en serait-il autrement aujourd*hui alors qu'il parait mieux equipe que jamais pour le faire? 
Apres la periode de mise en place de Tarsenal des mecanismes de formation des mots en fran$ais au 
Moyen Age, toutes les epoques se sont heurtees au besoin de conlrer les langues etrangeres (arabe, 
latin, italien, anglais) ou de combattre des jargons scientifiques, juridiques, scolastiques, 
ecclesiastiques et theologiques, et mSme techniques. Chaque etape de Thistoire du frangais atteste 
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amplement des efforts d'emancipation reussls : au XVI« siecle, la langue du peuple commence i 
prer Ire le pas sur le latin dans le domaine juridique (Edit de Villers-Cotterdts en 1539), en medecine 
(chirurgie), en astronomie, en musique, ainsi de suite; au XVIII* siecle, les sciences naturelles et la 
chimiosont mieux pergues en ffan?ais. Peu importe les 6poques, un seul motif explique Temploi du 
veraaculaire : Tusagef ordinaire de la langue generale et le consommateur de technolectes ne peut 
plus decoder les terminologies 3avantes ou etrangeres. Ainsi done des pans entiers du lexique spe- 
cialise ont echappe peu a peu aux langues doctes en raiscn de I'incapacite des utilisateurs de parler 
ou de comprendre ces langues (Boulanger I988b:4-9). La force du besoin a servi de catalyseur afin 
d'encourager la naturalisation lexicale. 

Ce bref trace historiquesert de trame au problfeme du langage informatique d'aujourd'hui, qui se 
ramene en fait i savoir si le frangais peut exprimer sans contrainte les concepts de ce vaste domaine 
ou s*il doit Stre t la remorque de Tamericain, avant d'etre phagocyte par lui. La reponse cette 
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se fissurer, ou si Talarme n'est rien d'autre qu'une suite de fantaisies de linguistes. 

Quelques facteurs seront examines, dont les uns jouent en faveur du main tier- ci uv^ developpe- 
ment du frangais et dont les autres, sans atrc ncgatifs, ont ncanmoins des incidences non negligeables 
sur ses structures. Parmi ces facteurs, un seul est d'origine purenient linguistique. II no sera aborde 
que sommairement en raison du fait que la langue est constamment presente en filigrane dans les 
autres elements. De fait, elle les cimente tous en un r&eau de liens tres complexes. 



2. L'lnrv.wm«!tisatlon 

LMnformatique est un sect( ur de connaissance tres vaste et intimidant pour le neophyte ou le 
non-special iste. Cest aussi ul domaine mythifie par la langue et le vocabulaire employes, a savoir 
Panglais ou plus precisement une certaine forme d*anglais qui s'apparente t une langue qua.M artifi- 
cielle ou S un metalangage. Au d»part, Tinformatique est une technologie importee dans le monde 
francophone. Une chercheuse constatait en 1973 que 90% du march6 fran?ais etait occupe par des 
constructeurs am^ricains (Marcellesi 1973:59). Le vocabulaire a naturellement suivi la chose desorte 
que «remplci, qui semble abusif au profane, de termes anglo-americains, la difficulte m6me de la 
technique et le mystere dont elle est souvent entouree aux yeux du non-initie, rendent ce langage 
particulietement incomprehensible pour qui n*a aucune notion d'anglais ou d'informatique» 
(Marcellesi 1973:59). Malgre ses ouvertures franches, I'informatique demeure unechassegardee pour 
nombre d'utilisateurs potentiels. Les publicitaires eux^mdmes ne s'emploient guere a re:soudre le 
mystere. Cande diffuseuse de mots, la publicite «exploite et demultiplie toutes les denominations 
susceptibles de flatter les mythes ou les prejuges del clients virtisls. Or elle considere [...] les 
termes etrangers comme des «mols-qui-font-vendre»» (Quemada 1 978: 1228). 

Depuis longtemps et dans plusieurs milieux, on souhaite que des efforts serieux soient accomplis 
pour r^ndre I'informatique plus accessible, plus comprehensible au vaste public. Derriere ce desir 
relie t la diffusion du savoir technologique, se profile le seul et unique moyen rentable de realiser la 
tache. II consiste i offrir la terminologie en fran?ais ou plutdt a rendre fonctionnel le vocabulaire 
disponible. En realite, c'est plut6t la micro -informatique qui est pointee ici puisqu'il appert que la 
macro -informatique demeurera sans doute encore longtemps Tapanage des speoialisle informatioiens. 
Si la macro- informatique lepresenie une micro-culture technicienne, i inverse la vulgarisation plus 
rapide de la micro -informatique fagonne une macro-culture nouvelle. 



3. La miniaturisation 

Les generations d'ordinateurs s'enchainent avec comme double objectif «la necessaire decrois- 
sance des dimensions des machines et la recherche de marches nouveaux» (Goujon 1985.400j, sans 
compter le desir d'augmenter la puissance des logiciels. Afin de repondre a ce voeu et depuis le 
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debu: de la decennie, la cartographie informatique se ramifle en de multiples sous-secteurs et applica- 
tions qui favorisent sa uif fusion sociale. Ainsi en va-t-il de la domotique, de la servitique, de Ttdi- 
tiC|Ue, de Tautotique, alors que des domaines de Tactivite traditionneUe se micro-informatisent. Le 
mouvement vers la miniaturisation des equipements s'amorce vers 1960. Le premier micro-ordinateur 
du monde, le Micral, apparait en 1972 tandis que la premiere boutique de micros ouvre en 1975 A Los 
Angeles (Goujon 1985:401). A Theure actue.lle, les incidences de ce phenomene sur les avancees ou le 
recul de la francisation sont difficilement intiurables. Cependant, les attentes sont nombreuses com- 
me le demontrent les recherches et les enqudtes nienees aupres des usagers de Tinfographie dans les 
domaines artistiques (arts visuals en particulier) et culturels (Turcotte 1988). 

Le developpement f uigurant et recent de quelques technologies a entraine le passage oblige de la 
macro- informatique k la micro- informatique. La miniaturisation a donne une nouvelle impulsion aux 
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pour mentionner quelques domaines qui nous concernent de plus pres. A ce chapitre, il est clair que 
les «resultats de Tinformati :3ue linguistique favorisent le developpement, la fabrication et la commer- 
cialisation des technologies et des produits tout h fait revolutionnaires, qui rendent d'indeniables 
services dans diverses spheres u'activlte» (Boulanger 1988b.l9-20). SimuUanement, ie poids et 
rinfluence de la langue anglaise se sont accrus dans le monde. L'anglais consolide place privile- 
giee et sa position de force par rapport aux autres langues. Pressees de s'equiper et de fonctionner 
avec ces nouveaux outils revolutionnaires, peu de societes se sonl penchees sur Timpact que cette 
technologie provoque sur Tensemble de la ou des langues en usage dans ces communautes ou sur leur 
territoire. feblouis par les possibilites nouvelles et par la doxa informatique, quelques pays africains 
francophones ont introduit Tanglais dans leur projet d'amenagemenl linguistique dont le premier 
objectif consistait k promouvoir les langues nationales. Des projets prennent du retard ou sont 
repousses, ils passent au second plan pour se dissoudre enfin dans le faux brouillard de la moderni- 
sation. L'industrialisation et la planetarisation massive de Tanglais creusent davantage le fosse entre 
les langues. L'ecart s'agrandit en faveur de la langue des producteurs de systemes et d'outils. 
L*informatique ^^rande ou petite, materielle ou logicielle, est pensee, produite et surtout comniercl^Ii- 
see par des entreprises americaines, Les objets sont exportes vers d'autres milieux c:;nsommateui^ cjui 
les acceptent tels quels, avec dans leur sillage les termes allogenes demeures intacts (les emprunts) ou 
legerement retouches pour prendre un visage en apparence fran^ais (les caiques) (Boulanger I988aj. A 
Toccasion, quelques notions parviennent a donner naissance a des creations internes originales qui 
sont a leur tour reexportees avec succes vers Tanglais (ex. telemaii^ue -> telematics), demontrant 
qu'un aller-retour est parfois possible. 

Mais il reste qu'on dit et ecrit frequemment que Tinformatique est une «Iangue» peuplce d'em- 
prunts etde caiques, une «langue» difficile, voire impossible a traduire. Quand on observe Taugm^n- 
tation de Tamplituf' de Tinformatique dans les activites quotidiennes, quand on constate raccrois- 
sement de la vitess de penetration des trouvailles technologiques dans la vie courantc d'une annee 
sur Tautre, on est en droit de se poser des questions sur Tavenir du frangais dans Tespace micro- 
infor/Tiatique. D'autant que jusqu'^ recemment, Tinformatique s'eiali limilee ^ jouer le plus souv^ai 
un r61e de support pour transmettre '/information lexicale. Desormais, elle devient en plus Tinforma- 
tion lexicale en soi, justifiant aux yeux de ses ardents defenseurs qu'elle pourrail aspirer au statut de 
langue. Isombreux bont ceux qui croient que Tempire informatique s'identifie ^ une «Iangue/> multi- 
nr.tionale qui depasse le strict niveau lexical pour fonder sa propre syntaxe. Le lexique, > compris la 
variation d'entreprises, la grammaire et la syntaxe se combinent pour generer un pur metalangage, un 
code aux regies internes bien contrdlees et appartenant aux seuls tenants de ce savoir. Le techno- 
lecte informatique ne risque- t-il pas ainsi de se transformer en un artifice qui deviendra bientOt si 
sophistique et marginalise que n**! ne le comprendra si ce ne sent les puiS ingenieurs informaticiens? 




4. La banalisation 

La miniaturisation ou Tatomisation z eu comme ef fet secondaire de permettre a Tinfurmatique de 
percer le marche domestique et d'elargir sa palette d'influence. La micro- informatique constilue 
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desormais un facteur culturel et social non negligeable, qui a des repercussions sur de multiples gestes 
quotidiens des mdividus non prepares h affronter cette technologie. Les logiciels se metamorphosent 
en produits de consommation banals, disponibles partout, concurrentiels, faciles d'utilisation et qui 
s adaptent aux besoins des utilisateurs. De plus, il sont de moins en moins coQteux Tout proprie- 
taire de micro devrait «pouvoir utiliser I'ordinateur sans rien connaitre du principe du traitement 
electromque de Tinformation ou de la programmation» (Meney et coll. I -37:2). D'oii la succes incon- 
testable des niecanismes comme la souris et les menus didactiques. Aver un minimum de debrouillar- 
dise, les «utilisateurs domestiques, ceux qui n'ont pas encore renonce, acquierent peu h peu une 
culture informatique suffisante qui leur permet de maitriser peu ou prou le fonctionnement de leur 
machine» (Goujon 1985:403). 

La diffusion sociale de I'informatique e itretient semble-t-il un ecart entre les i,sagers ordinaires 
et les professionnels de la technologie. Des recher.hes et des enquStes recentes ont demnnfrA nii^ 
«parim les categories d'utiiisateurs, seuls les professjo,^nels et les informaticiens semblent prefeler 
travai.ler avec des logiciels de langue anglaise» {Rapport d'etape du comite Canada-Quebec sur le 
diveloppemem du logiciel d'expression frangaise \ 986:2). En d'autres mots, le simple citoyen se plaint 
ou se plaindra du rdle predominant de I'anglais. Ceci oourrait avoir des co.nsequsnces economiques 
ddsastreuses lorsque \e plafonnement des produits sera atteint et qu'il faudra trouver de nouveau.x 
debouches. La maitrise du langage etant essentielle t la maitrise des produits, il est evident que les 
rapports du langage avec la connaissance et la pensee, et avec la realite et la pratique, doivent 6tre 
soignes. 

^ L'inforinatique, ou plutdt la micro-informatique, doit se franciser pour la bonne et unique raison 
qu elle se banahse. Elle sort du cercle etroit et du despotisme des specialistes. En se vulgarisant 
elle engendre des exigences et des attentes en vertu dss usagers qui se multiplient et qui I'utilisent 
comme un moyen, un outil et non comme une fin. En se transformant en objet quotidien en eten- 
dant ses zones d'intervention, I'informatique perd son caractere d'alchimie, ce qui en fait une bonne 
candidate a la francisation. 



5. La conscientisatioa 



La terminologie est I'une des ressources linguistiques disponibles dont se servent les societes 
pour assurer leurs metamorphoses et leur avenir. «En vertu d'une logique interne, toute 
langue 6volue et s'adapte au nouvel ordre de vJe d'une societe» (Boulanger I988b:3). Mais quand il 
s agit des langues de speciality, il faut y adjoindre une condition ; c'est la volonte collective d'agir 
sur la langue. Inscrif e des termes, des neologismes dans le cycle de I'usage .-eleve de considerations 
qui n ont souvent pas de grandes resonances d'origine linguistique mais plutdt des sources d'origine 
sociale, dans le sens !e plus englobant du mot. 

L'organisation rationnelle et fonctionnelle des travaux repose toujours sur le principe volonta- 
riste et valorisateur. L'amenagement linguistique du vocabulaire de I'informatique passe par le deve- 
loppement et le «confortement» d'une ideologie en ce qui a trait k la terminologie et a la neologie 
frangaises. Le terme amenagement linguistique designe ici «rensemb'e des dispositions sociaies qui 
innuenceront le comportement linguistique des individus au sein de .a societe» (Corbeil 1978:157;. 
Tandls que la neologie sera per?ue comme le processus auquel recourent les individus pour creer des 
mots ou des sens nouveaux dans une langue. Les innovations linguistiques servent a plusieurs fins 
parmi lesquellec on peut retenir les deux plus visibles : I - augmenter naturellement le stock lexical 
d une langue et 2 - permettre de transiter d'une langue h une autre en vertu d'un principe comme 
celui de la francisation. Les technolectes s'alimentent des denominations des deux types. L'lnforma- 
tique parait construire sa terminologie en s'appuyant davantage sur le second modele, c'est-a-dire le 
transfert par emprunt ou par caique, entretcnant ainsi I'image du palimpseste de I'anglais (Boulanger 
1988a et Humbley 1987). 
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Lorsque le phenomene de la conscientisation est evoque, le premier objectif k atteindre est 
certaineme" rinflechissement des comportement^ fixistes et elitlstes du corps informatique. Cest le 
seul moye. je faire face k la francisaiion de la pensee et du vocabuIa«fe de ce secteur technolecial 
et ainsi ue cesser de vouloir concurrencer Tanglais qui s'arroge le monopole de cetie terminologie en 
ce moment. Ne vaudrait-il pas mieux devenir agressif et offensif en franfais plutdt que de se defen- 
dre contre Tenvahisseur en mdme temps que Ton defend Tenvahisseur? Superposer le frangais a 
Tanglais de manifere impressionniste est peine perdue et releve d'une forme de snobisme et de com- 
plexe d'inferioriie linguistiques. II faut penser prioritairement en franyuis. Mais avant de penser en 
frangais, il faut se convaincre que le frangais peut faire face k la musiqub. 

Les actions en faveur de la f^ancisation de Tinformatique oni trouve un nouvel elan lorsque les 
Industries de la langue ont commence k ^merger vers 1984. Les applications industrielles du traite 
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dans des secteurs aussi divers que la sante, Teducation, la gestion, la securite, etc., en somme 
pariout ou I'informatique peut rendre des services. Si le frangais n'effectue pas de virage 
collectif et panfrancophone vers son industrialisation, «ses chances de se maintenir at niveau d'une 
langue internailoriaie voni en s'amenuisant, du fait de la pression croissante qu'exerceront, dans tout 
type de communication industrielle, ccmmerciale et scientif ique, les ordinateurs capables de manipuler 
Panglais, c'est-^-dire la langue des ingenieurs qui construisent aciuellement le plus d'ordlnaieurs» 
(Hagege 1987:249). 

Le contrdle socioprofessionel de touie terminologie ne peut 8tre assure que par les concep- 
teurs et les usagers Je ces vocabulaires. Pour ce qui concerne le frangais, on a assez repete, ei 
malheureusement pas assez compris ou accepte, que ce ne sont pas les Americains qui vont creer 
rinformatique en frangais. Plusieurs groupes pro.sssionnels francophone.^ semblent se compiaire dans 
cet 6tat d'attentisme qui se revele 6tre des plus nefasies puisqu'il ouvre la porte ^ testes les excuses 
ei ii toutes les exageratioriG. Le contrdle social de la langue existe puisqu'elle est un ^ien collectif. 
«Affirmer que c'est Tusage qui fait la langue apparait [comme] un faux-fuyant, car la question sui* 
vante s'enchaine : qui fait rusage?» (Corbeil 1978:158). 

Contrdler la langue peut dtre le debut d'un meilleur amenagemeni economique. On 
sait que le langage de rinformatique est une institution. Or Tinsiiiuiion est organisee a 
divers pallers, notamment : 

elle detient un pouvoir d'entrainement considerable; 
elle est un acieur social tres important; 

elle peut perturber le projet collectif si elle decide de se marginaliser; 

elle dispocc des moyens necessaires pour definir ses comporiemenis naiuiels langagiers e: 

pour definir sa norme de reference pour que ses comporiemenis s'y modeleni. 

L'orientation interne de la langue esi alors le fait de la somme des decisions prises par les indi- 
vidus qui forment le groupe dominant. La conjonction des espriis doit creer la d>namique qui per* 
meiira de concevoir que rinformatique en fran^ais est un chclx eclaire pour une so» *ete francophone. 



6. La terrainologisatioQ 

II ne fait aucun douie que Tin! jrmaiique est doiee d'un vocabulaire qui depasse la.gement 
plusieurs milliers d'unites. En outre, rinstrumeniaiion lexicograpb'que ei lermlnographique est a p^u 
pres au point. Lw banques de termes sont saturees, gonflees a bloc par des dizaine' de milliers 
d'unites lexicales de ce domaine. La bauque IBMOT consigne environ 25 000 termes, le diciionnaire 
de rOffice de la langue frangaise retrace 12 000 entrees, les dictionnaire^ classiques se compieni par 
centaines. Pour le seul sous-doinaine de la 'iureaui.'que, une recherche documeniaire a pe:m«s Je 
recenser 150 uiciionnaires compleis ou pariiels publies enire 1980 et mainienant (Cormier et Boulanger 
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1988). Le noyau dur de la terminologie de Tinformatique est presque entierement repertorie. II 
n'exige qu'un entretie-i peripherique sous la forme de mises i jour regulieres af in de reparer quelques 
errances ou de comb'- r quelques deficits lexicaux constates dans Tun ou Tautr noeud du svper-reseaa 
de la co^jiaissance qu'est Tinformatique. 

TouC le secteur est terminologise, consigne, repertone a I'envi. Cest I'impkntation, Tusage qa 
ne suit pas toujours, parce que la volonte est quasi nulle. La loi du laisser-faire et des voeu.; pieux 
remporte sur la conviction que le frangais pev.t relever le defi de Y i^formatique. L'idee e.t si 
profondement ancree dans les cerveaux que Tarbre cache la forfit. 11 ne faut pas se leurrer non plus; 
les linguistes ne peuvent a eux seul5 imposer I'usage des terminologies et aucune loi incitative n'abai- 
tra le mur de k resistance interieure, pas plus que les termes les ;: as esthetiques passeront dans !e 
discours des utilisateurs qui en refusent Temploi. 

On laisse Tinformatique se terminologiser en anglais en croyant qu'elle se francisera par la suite. 
Cest ]t une erreur de jugement fondamentale et la plus belle ;)reuve du -ansfert et de Taisimiiation! 
A bien examiner la situation de pres, on considerera que la francis . n consiste a transiter d'une 
langue * unc autre par ie recours aux emprunts, aux caiques et, pour uiie portion minime, fa la crea- 
tion interne naturelle. La terminologie frangaise actuelle de I'informatique resulte a peu pres inte- 
gralement du transfert du savoir-faire, des referents ou des notions elabor^s par les Americains. Le 
materiel linguistique americain est done adopte, grSce i Temprunt, et adapts, grSce au caique et ^ .a 
traduction.^ Le monopole de I'anglais n'est aucunement brise si la filiation demeure par trop visibie. 
II parait evident que desormais une langue vivante cornme le frangais doit se savoir capable de trar.s- 
fcrnier sa propre actuali^i en immortalite glorieuse et capitaliser sur son futur sans recourir a la 
mediation constante d'une langue etrangere et a des modeles technolectaux allogenes ou importes. 



7. Cv i.clusion: Rien se perd, rien ne se cr6e 

Dans Tintroduction, a 6te signale comment tout au long aes sieclei ,1e ThJstoire du frangais, 
des speciahstes ont ete sensibles aux difficultes, au ressourcement et a revolution de leur langue! 
Seuls les domaines ont varie au gre des besoins des usagers et d^s decouvertes soientif .ques ou tech- 
nologiques nouvelles. Au XVI* siecle, les specialistes avant-gardistes se sont mis a combattre le latin 
et Pitalien, a lutter contre des jargons rccI6siastiques, scolastiquti et juria.'ques. Au XX* siecle, on 
se plaint de Tinvasion massive, outrageuse parfois, de I'anglais, on epingle les jargons que sont la 
piupart des technolectes, et parnii eux I'informatique prend place au premier rang. Le caroussel du 
temps n'a fait que deplacer les pdles d'attraction et fournir des moyens auxquels les epoques passees 
n'ont pu recourir, et pour cause. Depuis cinq siecles, I'elargissement continu des cadres du lexique 
gen5*ral et du lexique terminologique frangais est un processus reiteratif dialectiquement lie aux 
chanijements et aux demotivation: observes dans les societes qui se sont succedees. «Cest la une 
caraa^^ristique profonde des langues humaines, qui d'usures en refections, parcourent les voies d'un 
6terneJ retour» (Hagege 1983:59). 

II n'est pas plus difficile de creer des mots franjais en informatique que dans n'importe quelle 
Jiutre sphere des connaissances. Les mSdecins et les mineralogistes ont d*»$ regies qui lonctionnent et 
dont ils s'accommodent. II n'est pas plus difficile de former des neologismes a Tere de Texploration 
spatiale qu'au sieck de Rabelais. En soi, une langue peut tout nommer. «La decision de fon^^tioniier 
dans sa langue maternelle ou dans une langue «nationaIe» (en elaborant des terminologies^ ou de .se 
r6s-"gner a emprunter la langue-outil avec la matiere a travaillei est politique, car toute langue est 
capable de tout nommer : I'impression trop frequente que certaines semantiques ne peuvent repondre 
au besoin notionnel releve de rideoIogie» (Rey 1979:66-67). 

^ Dans la francophonie d'aujourd'hui, la francisation et la neologie s'appuient sur des fondementb 
institutionnels solides. La creation linguistique est systematisee et organisee ratio -ir.ellement un peu 
partout ou I'amena^ement linguistique est en cours. Les organismes d'intervention sur la langue qui 
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emanent des politiques linguistiques ont le pouvoir ie creer, d'harmoniser et de normaliser des 
terminologies. Malgre quelques orreurs de parcours ^bservees a Toccasion, ils accomplissent un 
travail dont les resultats sont fiables et probants. La resistance et les rejets proviennent des milieux 
socioprofessionnels, des groupes qui ..ont les premiers producteurs et utilisateurs de termes tt qui Iei> 
repercutent sur Tensemble du public. Quant a celui-ci, il perpetue dans I'usage ce qu'on lui enseigne 
et il fait vivre les mots qu'on lui vend avec les produits qu'il acquiert. 

Le fran$ais devra sa place dans I'espa^e informatique a Taugmentation des usagers ordinaires 
et a la vulgarisation de la technique. L'un des fondements du processus de motivation demeure la 
synergie entre la langue et Telement humain qui genere la volonte d'agir. Sortir du ghetto termi- 
nologique des superspecialistes ne suffit pas. Li francomanie de la societe moderne doit resolument 
etre associee aux aspirations socio-economiques et volontaristes qui conditionnent le deploiem^ini des 
communications linguistiques en «Iangage maternel fran$ois». Tout reexamen du statut du franyaii) 
dans rinformatique est commande par cette premisse. Au fond, le probleme est relativement simple . 
ce n*est pas la quantite de fran$ais dans la micro-informatique qui est mise en cause, mais bien son 
statut. II faut oeuvrer avant tout sur Tamenagement du statut du frangais en informatique, c'est-a- 
dire sur sa capacite fonctionnelle de vehiculer la technologie aussi bien dans les hautes spheres 
specialisees que dans les conversations courantes. L'ensemble des facteurs de resistance, qu'ils scient 
d'ordre linguistique, sociolinguistique, ps>choIinguistique oa extralinguistique, se ramene a reva- 
luation du systeme de la langue et non pas au corpus, c'est-a-dire i la generalisation d'un usage pris 
comme modele. 

Enfin, il faut bien s'avouer que si rinformatique parait etre un langage, elle ne peut certaine- 
n;ent pretendre etre une langue. Cest un sphinx qui peut etre dompte. Si Ton examine attentive- 
ment la petite famille lexicale de depart, on remarque qu'un seul des quatre termes n'a pas ete pense 
en f ran^ais. En effet, ordinateur^ informatique et logiciel sont des formations autochtones tandis que 
artificiel^ malgre son allure fran$aise, est caique sur Tanglais artificiaL II est a noter que oramaieur 
et logiciel ont evince des concurrents anglais {computer et software) en peu de temps, quant a aru- 
ficiel^ son integration est complete, facilitee qu'elle fut par Texistence d'un homon>me franyais. 

Une idee implicite doit s'incarner dans le corps doctrinal de chaque ordre de la connaissance, 
s'incarner assez profondement pour n'avoir jamais besoin d'etre formulee, sinon de biais et comme 
avec une pudeur reverencielle. L'idee consiste k croire que la verite du politologue, du medecin, du 
savant, du technicien, en somme du specialiste, est incapable de devenir la verite de tous si elle se 
contente de demeurer cantonnee dans son expose technique ou scientifique. Pour atteindre le lieu ou 
elle sera unanimement accueillie, cette verite doit savoir renoncer ^ Torgueil de sa speciallte pour se 
faire eloquence, c'est-i-dire recevoir Tapprobation des usagers convies au banquet linguistique. Ce 
qui suppose le choix d'un lexique et de ternies attestes par un passe fran^ais et trempes dans une 
matiere reconnue par tous. Par dela les formes seleciionnees, !e mo^l^^Ie p*. ilegie doit valoriser «une 
elegance et une clarte heureuse qui endent la verite seduisante et transparente a tous, un pathetique 
et une force d'imagination qui sache faire aller la verite jusqu'au coeur de tous» (Fumaroli 1986.382). 
Le reste appartient a Thistoire de demain. Personnellement, je ne doute pas que le fran^ais ait une 
destinee canonique en informatique, capable de lui assurer un avenir prometteur a Tenseigne de ce 
que lui souhaitait deja Ronsard t la Renaissance, qui fut Tune des grandes epoques fastes de Pincuba* 
tion de la la..^je fran$aise. Laissons au fran$ais contemporain le temps d'accomplir son ceuvre dans 
chaque sphere du savoir. 



0* Jean-Claude'S^^njser 
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Cette etude a pour objectif de creer un outil d'aide t revaluation de textes dans le domaine de 
rinformatique, du point de vue du degre de difficulte du vocabulaire. Le resultat d'une telle etude 
serait destine & un eventuel lecteur voulant selectionner des textes adaptes a son niveau de com- 
prehension et a son experience. L'utilisation d'un indice de difficulte devrait permettre de distinguer 
les textes de vulgarisation des textes techniques. 

Un tel outil doit Stre partiellement automatise pour faciliter la t^che des evaluateurs et augmen- 
ter ainsi le nombre de textes pouvant dtre evalues. 

Jusqu*a maintenant, peu de recherches ont cte effectuees sur le degre de difficulte des textes, 
du moins en ce qui concerae la difficulte uu vocabtjlaire. L'evaluation de la difficulte des textes 
etait plutdt basec sur la complexity des structures de phrases et la densite de Tlnformation contenue. 

Cependant, trois domaines de rechexche, sans toucher directement le sujet de cette etude, abor - 
dent la notion de difficulte du mot et peuvent guider nos recherches. 

D'abord, Tens/gnement du vocabulaire en langue seconde, surtout depuu les annees I960, a 
donne lieu a une classification du vocabulaire en fonction de la difficulte d'apprentissage. Quelques- 
uns des criteres utilises pour cette classification peuvent s'intc^ier dans la creation d'un indice de 
difficulte lexicale tandis que d'autres n'apportent aucune indication utile. Nous pensons, dans ce 
dernier groupe, k la frequence d'apparition des mots dans le discours. 

Dans le domaine de la statistique lexicale, vers la fin des annees 1970, des criteres de 
classification des mots ont ete emis. Certains d'entre eux, en particulier la categorie gramma- 
tical, le mod** de formation et la complexite graphique, sont susceptibles d'influencer le degre de 
difficulte du vocabulaire* 



Enfin, la psychologie du langage s'est penchee, vers 1980, sur la comprehension du mot. Ces 
recherches ont fait ressortir des elements influenjant le degre de difficuite. II s'agit de la longueur, 
du degre d'abstraction et du Jegr6 de specificite. On dit qu'un terme a un haut degre specif ici.e 
LrsquMI n*est pas general, qu'il a un contexte d' tilisation restreint, c'est-a-dire qu'il est adapte a 
une situation donnee, e$ n'est pas facilement transportable. 



Pour resumer, !es rechercht^ disponibles actuellement ne poric**t pas specif iquement sur le degre 
de difficulte des textes en fonction du vocabulaire. Nous en sommes encore au stade de la reche**he 
d'une methode d'evaluation. 



^Communication pr^sent^o lors du 56® Conjris dc TACFAS Moncton, 9-!S mai 1988. 
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II paraissait interessant, pour tester la methode preconisee, de comparer deux textes du point de 
vue du degre de difficuUe. Idealement, ces deux textes devaient traiter du mgme sujet mais a des 
degres de difficulte presumes differents. Notre choix s'est porte sur le Guide de Imager et le Ma- 
nuel dsj reference du systeme d'exploitation Microsoft DOS. 

L'hypothese avancee veut que le Manuel de reference piesente de plus grandes difficultes que le 
Guide de Vusager, comme c'est habituellement le cas pour n'importe quelle documentation se rappor- 
tant k un logiciel. 

La premiere etape de I'analyse consis*c k saisir le texte au moyen d'un editeur de texte conven- 
tionnel et cor-^porte une recherche des syntagmes. En effet, on sait que le vocabulaire technique, et 
plus specialement ici le vocabulaire de I'informatique, recele de nombreux syntagmes. La definition de 
^yntagme est ceUe du «syntagme termino!ogique», k savoli une Suite ue mois qui refere a une notion, 
sans que ces mots soient unis par un trait d'union (ex. : «chemin de fer», dans la langue generale et 
«unite de disquette», dans le vocabulaire de ^'informatique). 

Les elements de syntagmes doivent 6tre regroupes avant de proceder a Panalyse du vocabulaire. 
Les syntagmes du vocabulaire specialise sont reperes manuellement et les espaces entre les mois qui 
les constituent sont remplaces par des caracteres quelconques, en Toccurrence des traits de souli- 
gnement. 

La segmentation en mots peot ensuite fitre effectuee grSce k un programme qui separe le texte 
aux espaces et aux ponctuations. Les syntagmes, qui ne sont plus entrecoupes d'espaces, conservent 
leur unite. 

Le fichier obtenu apres la segmentation contient tous les mots du texte initial, v compris le 
vocabulaire de la langue generale. Les mots qui appartiennent au vocabulaire de Tinformatique doi- 
vent 6tre reperes et marques pour cc .istituer une liste des mots h analyser. 

La deuxieme etape comprend le choix et la ponderation des variables. Elle debute par la cons- 
titution d'une liste, aussi exhaustive que possible, des variables susceptibles d'influencer le degre de 
difficulte. II n'y a aucune selection k ce niveau : toutss les variables potentielles sont conservees. 

Ces variables sont classees en deux categories, soit les variables lexicales et les variables con- 
textuelles. Le premier groupe comprend la categorie grammaticale, la longueur du terme, le degre 
d'abstraction, I'origine ou mode de formation, le degre de specificite, la complexite graphique et la 
motivite, cette derniere se definissant par la propriete c** terme de representer les signes distinctifs 
essentiels de Tobjet dont il designe le concept. Les va^ables contextuelles servent a indiquer la 
presence d'elements susceptibles d'expliquer un terme. Ce sont la definition, fexemple, ^illustration, 
le contexts encyclopedique, les synonymes et les collocations. 

La methode pour la selection et la ponderation des variables selectionnees a pour point de 
depart une grille dont un exemple sfmplifie apparait a la figure 1. 
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La grille de la figure 1 etant un modele simplifie, elle ne comporte ni toates les variables a 
analyser, ni un nombre de termes suf fisant pour obtenir des resultats probants. De mdme, les valeurs 
numeriques sont aleatoires et fournies siraplemer.t t titre indicatif. 

La grille est composee d'une colonne par variable et d'une ligne par terme, chacune de ces 
lignes contenant les valeurs associees & chaque variable pour ce terme. II n'est pas necessaire, pour 
cette etape qui vise & choisir et ponderer les variables, c'inclure tous les termes specialises du texte. 

La demiere colonne sert a iadiquer un degre difficulte intuitif pour chaque terme. Intuitif 
sigiiifie que ce degre n'est base sur aucun indice quantitatif, mais est piutOt issu d'une impression 
pcrsonnellc d6 la difficulte obseryes ^ Iz lecture. 

A partir de cette grille et au moyen d'l n logiciel de statjstiques, une analyse multivariee permet 
de determiner quelles variables ont influence le degre de difficulte u de mesurer I'independance 
reciproque des differentes variables de fa?on a pouvoir eliminer une variable qui aurait exactemcnt la 
mdme influence qu'une autre sur I'indice de difficulte. 

L'analyse multivariee revele aussi dans quelles proponions chaque variable influence le degre de 
difficulte. Par exemple, il se peut que la variable 1 contribue a trente pour cent dans I'indice de 
difficulte alors que la vari«jle 2 n'influence que dans une proportion de dix pour cent. 

Pour que cette ter Jque de selection soit validee, il faudrait que la cote de difficulte choisie ici 
intuitivement, s'appuie plutdt sur une enquSte aupres des usagers. Une telle validation implique 
Telaboration d'un questionnaire demandant i des lecteurs d'indiquer, pour chaque terme, une cote de 
difficulte sur une ';helle de 1 k 10, et de faire parvenir ce questionnaire t un nombre relativement 
eleve de porsonnes jugees representatives de la population cible. Le travail decoulant de cette 
enqud^. depasse le cadre de la presente recherche. Nous nous en tiendrons dene t un schema theo- 
rique qui devra ulterieurement Stve valide. 

La troisieme etape consiste, pour chaque terme, i part ceux qui ont ete utilises dans la grille 
d'analyse et pour lesquels le travail a d6ji ete fait, k associer une valeur pour toutes les variables 
retenues. II n'est plus necessaire d'associer un degre de difficulte intuitif puisque ce p.^cede n'etait 
utilise que pour revaluation des variables. Les indices des autres termes sont calcules automati- 
quement. 

Le calcul des indices de difficulte fait I'objet de la quatrieme etape. II s'effectu^ selon la 
methode suivante : pour chaque terme, I'indice de difficulte est obtenu en multlpliant la valeur de 
chaque variable ponderation (liee au degre d'influence), puis en additionnant toutes les valeur^ 
ponderees. Le tOiai ,.,t ramene sur 10. 

Une moyenne des cotes de difficulte est ensuite calculee pour Tensemble du texte. Les degres 
de difficulte minimum et maximum rencontres sont egalement recueillis. 

Au cours de la cinquieme etape, les resultats obtenus k partir c*'s deux tcxtes du corpus sont 
compares pour verifier I'hypo^hese de depart, k savoir que le manuei de reference doit presenter un 
degre de difficulte plus eleve que le guide de I'usager. 

Une methode d'analyse de la difficulte des textes basee essentiellement sur le vocabulaire off re 
I'avantage d'aborder un nouvel aspect jusqu'i present tres peu explore. 

En ce qui a trait aux variables liees au terme ind^pendamment du contexte, autrement dit les 
variables lexicales, une telle analyse permet de n vJf'ectuer qu'une j>,ule saisie des valeurs de variables 
pour chaque terme specialise. Les m6mes valeurs sont automatiquement associees aux autres occur- 
rences de ces termes et peuvent dtre conservees dans un index pour s'appliquer a d'aatres textes. 
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Les programmes requis pour cetle etude executent principalement six taches : l'6dition de texte, 
la segmentation, la selection du vocabulaire k traiter, la saisie des variables lexicales, la saisie des 
variables contextuelles et les fonctions statistiques (choix et ponderation des variables, calcul de 
Tmdice de difficulte). 

Parmi ces programmes, certains doivent 6tre en mesure de traiter des difficultes particulieres. 

Nous avoas deji fait mention des contraintes liees k I'edition du texte, a sa segmentation et t la 
selection du vocabulaire. Quant aux fonctions du logiciel de statistiaues. elloc np nncont r,oe de 
probieme particalier. " ' '' 

II reste done k considerer les programmes de saisie des variables lexicales et contextuelles. 

En ce qui conceme les variables lexicales, il n'est pas necessaire de conserver une liste de 
toutes les occurrences presentes dans le texte puisque Ips valeurs des variables sont valables pour les 
differentes occurrences d'un m6me terme. Le programme doit done constraire une liste qui elimine 
les mots repris dans le texte. Cette fonction, bien que simple en apparence, exige que le texte soit 
prealablement lemmatis6 (les mots sont tous reduits k leur forme de base) sinon I'ordinateur conside- 
rera comme differents les mots disquette et disquettes qui possfedent cependant les mSmes valeurs 
pour les variables iexicales. 

Pour les variables contextuelles, les valeurs varient d'une occurrence k I'autre. Par exemple, il 
se pent que la premiere occurrence d'un terme ne soit pas accompagnee d'un exemple alors que ce 
dernier apparait avec la deuxieme occurrence. 

D'ailleurs, k partir du moment ou I'occurrence d'un terme est definie, les occurrences suivantes 
doivent 6tre aussl considerees comme etant defiiiies, mSme si la definition n'est pas repetee dans le 
texte. 

II convient done que cette valeur soit enregistree automatiquement pour toutes les occurrences 
qui suivent un mot defini, evitant ainsi la saisie manuelle d'une m6me valeur k plusieurs reprises. 

Le programme doit aussi 6tre capable de retrouver un contexte pour le presenter avec une 
occurrence afin de verifier la presence d'un exemple, d'une definition, d'une illusti Ation, etc., ceci 
pour permettre la saisie des valeurs des variables contextuelles. 

Pour consigner les valeurs des deux types de variables, il faut faire appel k deux fichiers : un 
fichier de lemmes avec les valeurs des variables lexicales et un fichier des occurrences accompagnees 
des valeurs des variables contextuelles. Le fichier des lemmes pourra servir ulterieurement pour 
d'autrcs textes. Son volume augmente au fur et k mesure que des termes nouveaux apparaissent dans 
un texte. Par contre le fichier des occurrences ne vaut que pour un seul texte. 

En conclusion, il serait interessant de teste la methode preconis6e ici sur un texte complet 
d'abord, puis sur des portions de texte de differenies longueurs et recueillies k differents endroits 
dans le texce entier pour determiner la portion de texte la plus petite dont I'analyse donnera le meme 
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resultat que celle du texte entier. Cela permettrait d'evaluer des textes sans en saisir le contenu 
entier, sans quoi la methode ne serait pas appliquable t un nombre suffisant de textes pour Stre utile 
^ des usagers. 

Des cotes basees sur les variables lexicales senlement pourraient au3si fitre mises a la disposition 
d'auteurs de manuels d'informatique afin de leur suggirer un vocabulaire adapte a la clientele visee. 
Par cxemplt. I'auteur d'lin livre d'initiation a Tinformatique pour enfants pourra 6viter ies termes 
pr6sentant une cote elevee ou, s'il doit les utiliser, veiilera k le^ definir addquatement. 

Pour conclure* nous rappelieron$ one I'analyse proposee ici en est encore au stade experimental 
et que des recherches plus poussees seraieat necessaires pour la valider. II reste done beaucoup de 
travail a faire pour obtenir une mesure d'^Svaluati. a du degre de difficulte des textes ^„ se basant Sur 
le vocabulaire. 
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II ':era question dans les pages qui suivent de rinformatique en frangais. Sujet qui est egale- 
ment de la plus grande importance pour Torganisme que je preside, compte tenu de ses enjeux enor 
mes pour la francisation et, en particulier, pour la francisation des entreprises. 



La Charte de la langue frangaise, ^anctionnee en 1977, concerne non seulement le statut du 
frangais comme langue officielle, en particulier son statut juridique, mais aussi son statut d'usage 
dans les principaux domaines de la vie publique : le travail, la consommation des biens et services 
ainsi que Tenseignement. 



Cest a des organismes gouvemementaux qu'a ete confiee Tapplication de la Charte, qui vise a 
faire du franr is la langue d*utilisation generalisee au Quebec. 



L'Office de la langue frangaise, qui fste son vingt-cinquieme anniversaire cette annee, a rec \ le 
mandat de definir et conduire la politique quehecoise en matiere de recherche linguistique et termi- 
nologique et de veiller ^ ce que le frangais devienne, le plus tdt possible, la langue des communica- 
tions, du Tavail, du commerce et des affaires dans les organismes de TAdministration et dans les 
entreprises. 



Le Conseil de la langue frangaise doit conseiller la ministre responsable de Tapplication de la 
Charte sur la politique quehecoise de la langue frangaise et sur toute question relative k Tinterpre- 
tation et k Tapplication de la Charte. 



La Commission de protection de la langue frangaise a et-^ institute pour traiter des questions se 
rapportant au defaut de respect de la Charte. Quant i la Commission de toponymie, elle a competence 
pour etablir les criteres de choix et les regies d*ecriture de tous les noms de lieux. 



Dans le cadre de son mandat, TOffice de la langue frangaise a dO sMnteresser ^ la nouvelle 
technologie qu'est Tinformatique lorsqu'on a constate que d'importants elements Je gestion de Tentre- 
prise Tutilisaient de plus en plus. 



En effet, jusqu'en 1979, rinformatlM**e etait surtout utilisee par les grandes entreprises qui 
avaient les ressources necessaires pour acquerir de grosses machines, de Tequlpement et du personnel 
specialises. 



Allocution prononc^e au Palais des Con^^ de Montreal, le 6 octobre 1987. 
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Cependant, dans les annees 1980, nous avons etc temoins de Tavenement de la micro-informa- 
tique et de rarrivee de nouveaux logiciels comme les traitements de texte et les tableurs electroni- 
ques. Mais surtout, nous avons assists k I'entree de Tinformatique dans la petite et moyenne entre- 
prise; puisquMl devenait possible d'avoir acces i la gestion informatisee i un coat abordable. 



C^s logiciels provenaient des Etats-Unis, etaient vendus en anglais aux entreprises et, souvent, 
ne pouvaient 6tre modifies. 



Utilisant des documents remis aux consommateurs au moment d'une transaction, tels que les 
factures, les re?us ou les modes d'emploi, bien des entreprises ont anglicise ce domaine a la suite de 
rarrivee de Tinforroatique. De plus, les documents administratifs internes sont, malheureusement, 
souvent pass6s du frangais 4 Tanglais i cause de Tinformatique. Nous assistions i un retour a Tan- 
glais par Tintroduction de Tlnformatique. 



Toutefois, il etait possible d'obtenir certains logiciels en frangais, ou de modifier, traduire et 
adapter certains logiciels de langue anglaise. La demmde pour ces produits s'accroissant, nous avons 
vu apparaltre des logiciels de traitement de texte capt^hles de reproduire les signes diacritiques du 
frangais, d^is logiciels de gestion completement francises, ce qui t6moignait d'une prise de conscience 
de la specificite du marche quebecois et d'une adaptation i la clientele francophone. 



Confronte k I'introduction de Tinformatique de fa?on massive au sein des entreprises et des 
organismes gouvernementaux, TOffice a, en 1983, charg6 un comite d'etudier la question de la fran- 
cisation de I'informatique. Ce comite a propose une serie de recommandations qui ont ete approuvees 
par le Conseil d'adminii^tration de TOffice en octobre 1987. 



Ces recommandations furent alors envoyees aux entreprises utilisant Tinformatique, aux fabri- 
cants et aux fournis.seurs de produits informatiques ainsi qu'aux organismes gouvernementaux. 



Selon les recommandations enterinees par TOffice, devraient dtre disponibles en fran?ais; 

Pour ce qui est de la documentation: 

la documentation publicitaire; 

les documents relatifs au materiel et aux logiciels; 

les cours de formation et le materiel didactique. 

Pour ce qui est du materiel: 

les inscriptions sur le materiel, sur les boutons de commande et sur les touches de clav'er, 
les accents frangais. 

Pour ce qui ect des logiciels: 

les menus, les commandes et les messages affiches a Tecran ainsi que les textes affiches a 
Tecran ou imprimes. 



Ces propositions, faites aux 370 000 entreprises etablies au Quebec et aux organismes 
de TAdministration, tenaient compte k notre avis des possibilites actuelles de rinformatique 
ainsi que de revolution previsible de la technologie, 
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Q faut souligacr que TOffice n'exige pas la francisation des langages de programmation ni la 
francisatioa des documents hautement techniques, souvent perimis des leur impression. L'Office 
ddsire, cependant, que les utilisateurs puissent travailler avec des outils en fran^ais et que les con- 
sommateurs puissent £tre servis en frangais. Ce qui, faut-il le mentionner, correspond aux attentes 
des uns et des autres dans la grande majorite des cas. 



II convient d^ajouter que ces propositions sont incluses dans les programmes oe francisation qui 
touchent les entreprises employant SO personnes et plus, ainsi que dans les programmes qui touchent 
les brganismes de I* Administration. Cc^ cnifcpridcs et ces GrganisnicS, dent TOff ice g^rc la francisa- 
tion, reprdsentent 54% de la population active du Qu6bec. 



L'Of fice constate aujourd'hui, avec satisfaction, que ses propositions etaient realistes. En ef fet, 
nous trouvons im grand nombre de logicicls en franfais poss6dant, d'ailleurs, tous les signes diacriti- 
ques de la iangue fran^aise. 



Une 6tude de 1986, effectu6e par le Centre de recherche en gestion de TUniversite du Quebec 
& Montreal, intitul£e «Le dirigeant qu6b£cois face & rinformatique)^ et t laquelle 1 725 dirigeants ont 
choisi de participer confirme que, dans une proportion importante, les entreprises quebecoises se sont 
infonnatis^es en franfais. 



Nous mentionnons ci-apr&s quelques rdsultats de cette 6tude. Le premier graphique donne les 
pourcentages d*utiIisation des logiciels frangais par les entreprises dans trois secteurs d'activit6. 



HGURE 1: 

Pourceutage des entreprises utilisant des logiciels franijais 
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Source: Le diriseant qtiib^coh face d Vinformaiique - 19B7, 

On constate qu'environ 45% des entreprises utilisent des logiciels comptables, de bureautique et 
de gestion en frangais. 

Les trois autres graphiques fournissent les pourcentages d'utilisation des logiciels en fran?ais 
selon la tai^^e de Tentreprise : logiciels comptables, de bureautique et de gestion. 
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nCURE 2; 

LogideU de bureautique 
utilise en fran^ftis selon la taille de reutreprise 
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Source: U diritem qu^bicois face d Vlnformcxique - 19B7, 



nCURE 3: 

Loglclels co:aptabIes en fraofais 
selon la tallle de Pentreprise 



60% 



pelitt 




ERLC 
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Source Le dirigcaju quib^ois face d Vinformciique - 1987. 



La t3/lle des entreprises, ainsi qu^on a pu le constater, influence grandement le choix de la 
langue des logiciels : In petites entrepriscs sont de bcaucoup les plus francisfies, suivies des entre- 
prises de taille moye . Par contre> h degri de francisati^n des grandes entreprises, pour ce qui 
est du secteur infok itique, est sigoificativement inferieur k celui des petites et moyennes 
entreprises. 

Ces differences s^expliqueut, selon les chercheurs, par le fait que les grandes entreprises se soat 
infonnatisies k Tipoque ofi &*6taient disponibles que les logiciels en anglais. Les petites et moyennes 
entreprises s*6tant infonnatisdes plus tardivement, elles ont eu accis 4 des produits informatiques en 
fraugais. 

n faut 6galement mentionner que les grandes entreprises canadiennes et nord-amdricaines ont 
beaucoup plus tendance k utiliser Tanglais. Toutefois, nous ddcelons au sein des grandes entreprises 
une forte tendance & Tinformatique en frangais, tendance qui devrait se consolider dans Tavenir, 
compts tenu des pressions de Tcpinion publique et du marchd parall&lement & revolution privisible de 
la technologies 

II faut ajouter que Tetude mentionaee plus haut ddmontre que beaucoup (^'entreprises veulent 
travailler en fran?ais et utiiisent des logiciels en frangais lorsque ces demiers sont disponibles sur 
le marchd. De plus, ces entreprises constituent une client&le 6norme peer des lojiciels en f rancais au 
Qu6bec o(i, ii faut le rappeler, il y a 366 000 entrepilses qui emploient 7 jin' de cinquante sal ^s. 
En outre, beaucoup de grandes entreprises songent actuellement ^ modifier le ar gestion mfcmiatique 
pour tenir compte de leur politique linguistique : ce qui dtait uniquement en inglais sen francisi ou 
biiingue. 

Ce qui vient d*6tre soulign6 ne doit pas donner Timpression que nous ignorons les diff icult^s de 
rimplantation de Tinfonnatique en fran^ais. 

Cependant, sans entrer dans les problimes u thniques qui sont du ressort des informaticiens, 
nous pouvons af firmer que ^les solutions intdressantes ont iih trouvees et que des chercheurs, tan; du 
secteur priv6 que du secteur public, dtudient la question. 

Un grand nombre d*entreprises of f rent d6j& aux utilisateurs quebecois du materiel et des logiciels 
de traitement de texte et de gestion en frangais, accompagnes de manuels d'utilisation en frangais. 
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^ La majout6 des logicz-ls concus au Quebec et adaptis aux entreprises qu6becoises sont dispo- 
mbles ea frangais. 

On ne remet plus ea question aujourd'hui la capacity des Qudbecois de creer des logiciels de 
langue fran?aise; leur rentabilite fait m6me partie de la pcUtique de mise en marche de grandes 
entreprises. 

L'exigence de conv:viaUte et, de plus en plus, lc« attentes des clients demandent une adaptation 
i la langue de Tutilisateur. 

Le matiriel informatique est maintenant francis6 : les claviers sont Francises chez IBM, Wang, 
Digital, HewlettPackard, Apple, AES Data, Northern Telecoia. lis le sont egalement dans d'autres 
entreprises qui utilisent, pour certains de leurs appareils, ce qui est communement appele. le clavier 
canadien-frangais, dont voici une illustration : 



CLAVIER CANADIEN-FRANCAIS 
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n faut souligner que les touches de fou.*«on du clavier ont ete francisees et qu'il est possible 
d jbtenir les accents frangais directement. 

Des etudes et des travaux sont actuellement en cours pour trouver des solutions a long 
terme aux problfemes que pose la francisation des logiciels. Parmi les etudes les plus interessantes 
pubh^es recemment, il faut signaler celles de Monsieur Alain Labonte, du Bureau central de rinfor- 
matique du ministdre des Communications du Quebec. La premiere etude traite des aspects techniques 
de I'utilisation du fransais en bureautique. La secoade etude, realisee dans le cadre des travaux du 
comitS Canada-Quebec sur le d6veloppement du logiciel d'expression fmnsaise, traite de I'apport du 
multilmguisme lors de la mise au point technique des logiciels. 

Ces deux etudes, dont la lecture est fortement recommandee, presentent claireraent des solutions 
aradaptation des logiciels aux differentes langues nationales et suggerent la conception de logiciels a 
portee multilingue. En plus d'etre 4 I'avant-garde de la reflexion dans ce domain*?, ces 6tudes lais- 
sent entrevoir des perspectives fort encourageantes quant i. la cooperation possible & I'echelle de la 
francophonie Internationale. 
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II faut signaler egalement que la Centrale des bibliotheques a repertorie les logiciels con?us au 
Quebec i Tinterieur d*une base de donnees appelee LOGIBASE. Celle-ci vise k repertorier 
tous les logiciels quebecois disponibles sur le marche pour torn les types et modeles u'ordinateurs. 

En plus de collaborer avec les organismes gouveraementaux qui s*interessent a rinformatique en 
franfais, TOffice fait la promotion des logiciels et du materiel informatique en frangais aupres des 
entreprises quebecoises employant 50 employes ou plus. 

La Direction des programmes de francisation a requ le mandat d*aider les entreprises ainsi que 
les organismes de TAdministzation ^ generaliser Tutilisation du frangais. Quatre mille entreprises et 
organismes sont done invites k utiliser des logiciels en frt^gais, ce qui peut dtre un incitatif puissant 
pour creer une demande de logiciels et de materiel Francises. 

L^Office a egalement publie une serie de lexiques et de vocabulaires susceptibles d'aider les 
traducteurs, concepteurs de logiciels ou fabricants de materiel i utiliser une terminologie frangaise. 
Mentionnons, cscre autres, le Vocabulaire du micro-ordinatew^ le Vocabulaire du logiciel et le Vo- 
cabulaire du traitement de texte. 

En plus de publier des vocabulaires, TOf fice de la langue frangaise permet Tacces k sa banque 
de donnees, la Banque de terminologie Quebec. Creee en 1974, la banque de TOffice cpntient 
aujourd*hui pres de trois millions de termes et peut €tre consultee de deux fagons. Les entreprises 
qui ont des besoins terminologiques importants et qui possedent le materiel informatique necessaire 
peuvent y avoir acces direclement par Tintermediaire des reseaux Datapac et Inet 2000. 

Les autres clients peuvent consulter la Banque de terminologie de TOffice par Tintermediaire 
d*un service d*acces en differe. Nos terminologues font alors des recherches dont les resultats sont 
transmis aux usagers. 

Ces etudes et ces travaux denotent bien notre volonte d*offrir k nos clienteles des produits 
adaptes k leurs besoins. « 

Insistons sur le fait que TOffice, dans ce domaine de son activite, travaille toujours avec 
I'etroite collaboration des organismes et entreprises specialises, et non pas en vase clos. 

En fevrier 1986, les miuisteres des Communications du Canada et du Quebec formaient un 
comity sur le developpement du logiciel d*expression frangaise. Le comite avait pour mandat d'exami- 
n.3k' Tensemble des problemes que vit Tindustrie du logiciel d'expression frangaise et de formuler des*" 
recommandations quant i Tavenir de cette ind istrie. 

Au debut de 1987, la Federation d*informatique du Quebec e< TOffice ont participe k la vallda*- 
tion de ces recc .mandations. Les plus significatives d*entre eiles sont les suivantes : 



Multilinguisme « 

1- Encouragcr la creation et la commercialisation de logicieh en frangais k portee multllingue, 
congus de maniere k pouvoir incorporcr les caracteres fondamentaux d'une ou plusieurs languts. 



Aspects techniques du frangais 

2- Informer Tentreprise et lui offrir toute autre forme de soutien quant aux operations techniques 
exigees par le traitement du frangais en informatique. 
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CoDformitS aux normes et usages 

3- Informer I'entreprise des travaux de normalisation en cours sur la scene nationale ou intema- 
tionale, ayaat une portee linguistique oc culturell:. 



Tradttction 

4- Encourager la recherche appUquee dans les domaines suivants : la traduction et Tadaptation 
de ogiciels a portee multilingue (ex. traitement de texte), de logiciels de traduction assistee 
et d outils d'aidi) k la traduction. 

Cooperation avec la fraccophonle 

5- Favoriser les projets de logiciels en frangais qui necessitent la cooperation des pays franco- 
phones. 



RAle des gouvemements 

6- Faire usage du pouvoir d'achat des gouvemements et de son effet d'entralnement sur TJuaustrie 
pour exiger des logiciels en fran^ais k portt. nultilingue, ds conception canadienne et cop.formes 
aux normes reconnues quant au traitement du fran95iis. 



Ces recommandations oot pour objectif le devcloppement des produits congus par nos entreprises 
(cette activite etant creatrice d'emploi) et facilement exportables sur le marchs mondial. 

• ^ ^h^^^^ souligne qu'il est urgent que Industrie quebecoise tire profit du caractere Unguis- 
tique pa^tjcuher du Quebec en Amerique du Nord et developpe, pour I'exportation, des logiciels utili- 
sables aus?t bien en franfais qu'en d'autres langues. 

n semble urgent de coacrctisei ces recommandations et de profiter du fait que les deux gouv^r- 
nements consentent a IravaiUer i. jn prcjet commun, soit le developpement de Tindustrie inf ormadque. 

n est aussi imperatif, aprds avoir fait le tour de la question des possibilites de francisa»Jon of 
s etre rendu compte que tou^ n'a pas ete fait d'admettre qu'il reste encore d'autres defis a relever. 

Ainsi, p.n ce qui a trai: k la langue, il va falloir coniinuer les travaux ds terminologie et <'e 
normalisation avec la francophonie, et faire la promotion et la diffusion des termes aupres des 
utihsateurs. L'Off ice peut s'eiigager k poursuivre la collaboration avec les entreprises d'informatique 
et a rester-a I'Scoute des preoccupations de cette industrie. 

II faudra notamment fjouver des solutions concemant la compatibilite des differents langages et 
mater:els et s'entendre sur une norme relative k la position des signes orthographiques sur les cla- 
viers d'ordinateurs. 

Les utilisateurs doivjnt pouvoir uUliser leur propre langue et, pour ce faire, la conception de 
logiciels k portee multilingue devra gtre generalisee. Les grandes entreprises araericaines comme 
Microsoft, IBM, Digital tiennent naintenant compte des differentes langues Rationales. La conception 
de ces logiciels k port6e multilingue pourra permettre k nos entreprises d'informatique de servir le 
march6 quebtfcois tout ea espenut atteindre le marihe mondial. 
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Comme pour n'importe quel produit ou service, les concepteurs devront se tenir i Tecoute de 
leur clientele pour faire en sorte que les nouveaux logiciels soient plus performanis, plus faciles 
d*utilisation et que leur prix de vente soit le plu'j competitif possible. 

L'Office a I'intention de maintenir ses denrtandes en ce qui a trait k la francisation de I'infor- 
matique tout en tenant compte des difficultes inherentes cet objectif. 

Dans cet esprit, nous voulons ' yntinuer d, travailler en collaboration avec les differents paliers 
de gouveraement afin de tavoriser I'achat et 1' utilisation de logiciels en frangais. Nous voulons 
egalement collab^rer avec les entreprises d'informatique afin de continuer k prodiMre des lexiques et 
des vocabulairf lusceptibles d'dtre acceptes et uvilises. Nous voulons aussi contin^ ^r k examiner, 
avec les differents intervenants, les solutions techniques acceptables pour la francii..*on des entre- 
prises. Enfin, nous voulons intervenir aupres des ovi aismes de normalisation. 

En coDtrepartie, nous souhaitons que les entreprises u ^nformatique donnenc satisfaction aux 
marches francophones quebecois et canadien. Ainsi, les concepteurs et les fabricants devraieni adapter 
leurs produits aux milieux aazquels ils sont destines, et ils devraient rendre simuitanement disponibles 
sur le marrhe les versions anglaises et frangaises de ces loeiciels. Les consultants et les conseillers 
devi'aient informer leurs clients Jes caracteristiqaes linguistiques de leurs products. Les distnbuteurs 
devraient offrir au comptoir foption frangaise cies produits. 

Noi^ sommes persuades qu'il existe une reelle demande pcur des produits informatiques en f ran- 
fais et que cette demande ne fera qu'augmenter. 

Pour con 'ure, rappelons que I'Office est au service de la communaute et veut collaborer k 
Tatteinte de Tobjectif que nous partageons . le developpement au Quebec du secteur informatiqu^. .... 
en frangais. 



LA LANGUE FRANCAISE: 
PR0BL£:M£S lyiNITIATION A riNFORMATIQUEi 

MichaSl Mepham 
Langues et linguistique 
Universitd Laval 



Cette communication porte sur les probldmes de franoisation tels que perfus avec les oeilleres de 
rexpirience et de la .'^flexion personnelles, acquises sur une p^riode d*un quart de siecle en qualite 
d^utilisateur et d^enseignant de Tinformatique linguistique t Tuniversite Laval, 



i. ProbKm^ttique et enjeux 

Vaut-il vraiment la peine de franciscr riniormatique? Si oui, quels aspects faut-il prendre en 
compte? Quels moyens faut-il prendre? Qui doit s'en charger? Nous ne proposons pas d*aborder 
toutes les questions qui sont pertinentes au th&me du colloque, mais plutdt, apr^ un bref survol de la 
situation g6nerale, de decrire celle, plus precise; de nutre enseignement ^ Laval, pour en tirer quel- 
ques lemons. 



1 . 1 Les inconvenients 



Au depart, il y a une realite qui sMmpose de fafon bmtale : le francais comporte des inconve- 
nients. Vouloir fonctionner en frangais entraine certaines consequences. 



Ll.I L*inconv6niexit des accents 



L*exemple le plus evident est celui des accents, II vaut la peine d*en parler encore; d'abord 
parce que les probl^mes caus^ par les accents ne 3ont pas encore tous r^solus, mais aussi parce que 
revolution de la situation nous renseigne sur les attitudes des gens. 



n y a vingt-cinq ans, les claviers les plus courants offraient une gamme reduit : de caracteres : 
on ne 3po ait que de 26 caractdres alphabetiques, tous en majuscules, sans accents, A cette epoque, 
il etait courant de conclure que le frangals etait mal adapte k I'informatique, Cest seulement plus 
tard que Tfiquipement et des logiciels plus evolues sont devenus plus f amiliers, que ce premier prejuge 
a commence & ceder d Tid^e que c*6tait plutdt Tinformatique qui n'etait pas bien adaptee au frangais. 



^Communication pr4Ss«uU« Ion du 56* Consrts de i*ACFAS» Mcncton, 0-13 mai 1988, 
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Un ev6nement anodin pennet d*illustrer & la fois le progrds accompli et les obstacles qui restent 
h franchir. L'annee derniere, lors d'une conference Internationale sur les bases de donnees dans les 
science-5 humaines et sociales, un conferencier am6ricain proposait des normes pour la transmission 
des donnees 4 travers les reseaux de telSoommunication. Dans Tauditoire, il y avait beaucoup de 
personnes qui s'occupaient de langues autres que Tanglais. La premiere recommandation etait ^ Teffet 
que tout le monde devait renoncer t utiliser des caracteres au-del^ du code ASCII 128. Le tolle qui 
a suiv3 a laisse le conferencier bouche bee. 



La transmission des donnees n'est pas le seul probleme relatif aux accents. Les logiciels 
courants font encore des tris alphabetiques o<i les lettres accentuees trainent comme des mouions 
noirs derriere le troupeau des lettres «nonnales». 



TABLEAU 1 
L'ordre alphab6tlque Inbv au code ASCII 



cela 
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Lorsqu^on traite des textes sans distinction des mots quant ^ la presence d'une majuscule sur la 
lettre initiale, on se retrouve avec des erreurs d*orthographe. Ce genre de probleme reclame une 
solution. 



TABLEAU 2 
Accents et majuscules 



Uxt« imprim^ : 

^ul, 11 ft donn6 un livre. 
A ' ui, 11 a donni un livro. 
... i lui, il a donn6 un livre. 

davisr IBM/PC : 

A a ... 

... a ... ... a ... 

conveition minuscule : 

a ... ... a ... 

(forme (forme 
de : a) dc : avoir) 



Kl 2 Le franfais ne peut pas bien s* adapter 

Oil peut soup9onner que mes qualit^s d'anglophone et de linguiste portent k croire que je peux 
parler d*autorit6 Iorsqu*il est question du langage dans le domaine de Tinformatique. De nombreuses 
personnes, rompues ou non k Tinformatique, ont aborde avec moi des sujets iinguistiques, et les 
discussions ont souvent d^passe les limites des connaissances bien etablies. Parfois, mdme si les 
opinions ne sont pas bien appuy^es sur le plan scientifique, elles sont re *clatrices de malaises ou de 
preoccupatio;::s reelles. Par exemple, une plainte formulee par certains informaticiens francophones 
est que le franjais ne peut pas s*adapter convenablement k de nouvelles realites, notamment celle de 
rinformatique. Tci, il faut entendre revolution du systeme linguistique, et particulierement le pro- 
cessus de formation des mots. En caricature, on presente le frangais comme un objet de grand art, 
qui, un peu comme les bijoux de la Couronne, serait garde jalousement par les membres de TAcademie 
frangaise. Le commun des mortels n*aurait pas le droit d'y toucher. 



II y a une fausse conception de la langue k la base de cette attitude. Les personnes qui parta- 
geat cette vision des choses la contrrdisent dans leurs propres agissements quotidiens, en utilisant 
all&grement des n^ologismes, des emprunts et des expressions qui s'ecartent de la norme. Mais ils ont 
le sentiment que ce quails font ne concerne pas le frangais officiel qui lui, ne court par les rues, du 
moins & Quebec. lis ignorent que c^est la somme des agissements individuels qui gouverne revolution 
de la langue. 
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Cette fausse conceptiorx est rev61atrice. Ce qui est per5u comme la norme Test en mSme temps 
comme inaccessible, ce qui enlfeve tout I'avantage utilitaire 4 I'existence de la norme. Une action ^ 
prendre pour changer de telles attitudes, si elle est concevable, est sOrement complexe, et devrait 
impliquer le systdme d'education, ainsi que tous les autres acteurs en amenagement linguistique sur 
une longue perlode. 



Plus concretement, ce qui 6tait en cause chez ces informaticiens anonymes etait la possibility de 
former de nouveaux mots. Prenons un exemple dans le domaine des loisirs, ou il a fallu nommer les 
concepts lies 4 ce qu'on appelle en anglais wind surfing. 



TABLEAU 3 
La formation des mots 



cat<goriq 



francait 



is sport 
i'ftction 



wind surfiisg 
a wind gurfer 
to wind surf 
ft wind surfer 



ift pl&nche & vcile 
line plftnche & voile 
fftire dd la planche h voile 
un viliplanchiste 



1.1.3 La mentality nord-americaine 



En poussant un peu plus lorn dans cette direction, certains francophones en viennent 4 rejeter le 
frangais en faveur de Tanglais en tant que vv^hicule de I'informatique. Les raisons sont nombreuses, 
mais il y a des themes recurrents, dont le principal est qu'il y aurait une mentalite liee i i^ langue 
frangaise qui n'est pas propice 4 la mentalite de Tinfonnatique. En jargon psycholinguistique, c'est 
Vhypothese Sapir-AYhorf. Une variante contradictoire de cette position veut que les francophones 
Canadians aient une mentalite nord-amevicaine, en depit du fait qu'ils parlent frangais. Entre ces 
deux positions, ou se situe la verite? 



Ces attitudes, fondees ou non, revelent un maLise que Ton ne peut pas 6carter du revers de la 
main. Qu'y a-t-il la-dessous? Est-ce la divergence socio-culturelle avec la France et la convergence 
vers le creuset nord-americain? 



Les indices g'.aaes daus certaines conversations permettent de croire & des causes moins globales 
et moins irreversibles po^r ces attitudes. II y a d'abord les inconv6nients mineurs abordes ci-dessus, 
comme I'exemplo des accents. Plus serieusement, il y a la question de la formation des mots qui 
vieat d'etre 6voquee, qui fait partie d'un probleme plus general de terminologie et de /ocabulaire, que 
les autres conferenciers pourront ddvelopper davantage. II est clair que I'absence de vocabulaire 
commun est une entrave i la communication, et I'acquisition de ce vc:abulaire par I'individu repre- 
sente un investissement intellectuel considerable. On peut comprendre que ceux et celles qui ont 
investi du c6te de I'anglais en raison du contexte, contribuent maintenant i la resistance ^ la franci- 
sation. 
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1.1 «4 Uanglais serait plus precis 



II reste un facteur que nous voudrions presenter sous la forme d'hypothese . aux neologismes 
d'origine fran?aise, on prefere les emprunts 4 Tanglais. La raison invoquee est qu'un terme emprunte 
i Tanglais pour un concept nouveau est univoque; il signifie par definition exactement ce que I'utili- 
sateur enteud. Bien entendu, un mot franrais peut egalement par definition signifier precisement la 
mfime chose. L'ennui, c'est qu'il peut tout aussi bien referer k plusieurs autres choses. Ainsi, la 
personne qui parle peut avoir le sentiment de cerner de plus pres son idee en utilisant un jargon qui 
pourrait k la limite venir du swahili. A la limite, car la relative familiarite de Tanglais contribue 
sCirement au phenomene. Souvent on entend dire, de la part d'etudiants ou etudiantes, au sujet des 
codes de commande pour un langage de programmation, que les termes anglais sont beau- 
coup plus precis que les equivalents frangais, par exemple : print par contraste avec 
imprimer pour Taffichage i Tecran en BASIC. L'ironie, c'est evidemment que pour les 
anglophones le choix de print possede tous les inconvenients de imprinter pour les francophones. Les 
anglophones f iniraient sans doute par trouver des qualites intrinseques au mot mprimer qui manquent 
au mot anglais. 



Supposons que cette liypothdse soit fondee. Alors, ne vaudrait-il pas mieux tolerer, ou mdme 
encourager Tadoption d*un sous-ensemble de Tanglais pc r Tinf ormatique? Ne serait-ce pas analogue 
k Tadoption d'une notation mathematique, comme pour le calcul dif ferentiel? Dans ce dernier cas, la 
reponse est clairement non, parce que la notation mathematique constitue un tout coherent bien 
circonscrit, relativement autonome at independant de la langue. Cest egalement le cas de chaque 
!angage de programmation, mais ce n*est pas le cas pour la langue de Tinformatique en general. II 
faut cimenter le jargon avec du mortier de langage ordinaire afin de constituer des phrases. L'effet 
le plus nuisible de cette tendance i creer des jargons est F^bligation qui est ainsi 
creee pour les utilisateurs d*acquerir un code supple mentaire pour acceder & Tautel des 
inities en informatique. 



1.1.5 La francisation des logiciels 



Un aspect crucial ^e la francisation concerne Tadaptation en franrais des logiciels courants. 
Cermits produits, par exemple WORjl; PERrECT, ont deji des version franfaises tres convenables. 
CelasigLifie que la documentation oxterne, la documentation interne (c'est-S-dire les fonctions d'aide) 
et Taffichage des messages et commandes sont tous en frangais. II faut souligner qu'il ne suffit pas 
d'un v-rni? frangais sur un meuble anglais. Si la touche «p» signifie print en 8 ,glais, il faut re- 
manier non seulement les messages, mais Tensemble des protocoles d'echange a* ec Tutilisateur en 
fiangais. 

Cet etat de chose entraine d'autres effets. Souvent le fait de travailler avec une version fran- 
false veut dire renoncer ^ utiliser la version la plus recente. Dans certains contextes, le retard peut 
entrainer une perte sur Je plan de la competitivite. 

La francisation d*un logiciel n'est pas simple sur le plan informatique, ni sur le plan linguistique. 
Dernierement, dans le cadre du projet RELaI, parraine par une entente entre Tuniversite Laval et 
IBM, les professeurs Lionel Meney, Denis Juhel et moi-mdme avons decortique le manuel et le guide 
de Tutilisateur du systeme d*exploitation DOS 3.2. Nous y avcns trouve de nombreux exemples d*em- 
ploi de mots qui contribuent a rendre le texte difficile pour un lecteur non averti. 
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TABLEAU 4 
Le vocabulaire du IBM DOS 3«2 



uniU, uniti d« difqu«tt« 

(IttcUur ou dUquette) 
form&Ur 
rtstaurer 

^ter 

ESC 

ERASE 

TYPE 

DIR 

TREE 

ONUNE 

CHKDSK 

MKDia 



hi. 6 Les publications en fran^ais 

II y a egalement le probleme des publications; ou plutOt les problemes. Ceux et celles qui 
se rtclament d'une mentalit6 nord-amificaine citent la difficulty qu'ils ont 4 lire les publications 
frangaises. 11 semble difficile de les contredire. Est-ce simplenL^nt un manque de familiarite avec la 
terminologie franfaise? Ou y a-t-il en France une tradition d'abstraction 4 1'extrSme, de thfiorisation 
4 outrance et d'obscurcissement savant qui contraste avec celle plus concrete, empirique et directe du 
monde anglo-saxon? II semble ose d'affirmer une generalite aussi grossiere. Quoi qu'il en soit, il y a 
une insatisfaction manifesto 4 regard des publications franfaises, que ce soit dO au contenu ou au 
style. Si Ton ajoute k cela le nombre relativement limitd de titres, le tableau est plutdt sombre. 



2« L'exp6rience d'enselgnement k I'universit^ Laval 

Certains arguments plus ou moins s6rieux ont ete mis de Tavant quant aux inconvenients entrai- 
nes par Tutilisation du frangais. Avant d'aborder le n^ve-s v ^ la medaille, et dans le but de justifier 
ces propos, nous decrirons ceraines facettes de notre expeuence d'une vingtaine d'ann6es d'ensei- 
gnement k Tuniversite Laval. 



2.1 Le contexte 

II s'agit de Tinitiation k Tinformatique d'etudiants et etudiantes en Lettres. Au depart cela 
signifie des personnes qui n'ont pas le profil «sciences» du niveau colleg^al. Une bonne proportion de 
cette clientele a une sainte frousse des systemes formels comme ceux des matheinatiques. Peu d'entre 
elles ont une connaissance prealable de Tinformatique. 

Le cours en cause s'intitule Automatisaiion linguistique, mis sur pied "vant meme Tapparition des 
micro-ordinateurs. L'objectif principal n*etait pas de maitriser un langage de programmation; il y 
avait k cei . Tet des cours au d6partement d*informatique. II s*agissait plutdt d*acquerir les notions 
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et principes qui sous-tendent Tautomatisation dans le domaine de la linguistique. Essentiellement, on 
voyait les algorithmes qui permettent des manipulations simples de textes en vue de la production 
d'index et de concordances. 

Ceux qui insistaient pour apprendre un langage de programmation pouvaient s'inscrire k des 
cours d'APL, de FORTRAN ou de PL/i au d6partement d'informatique. II devait mfime y avoir des 
sections de cours destinees ^ la clientele non-scientifique. L'experience etait assez concluante, de 
fagon negative : les ^tudiants et les etudiantes de la Facuite des Lettres trebuchaient sur des exer- 
cices qui leur ^taient difficilement comprehensibles, comme faire un programme pour calculer le poids 
que peut supporter un pont avec une telle structure. 

2.2 Les debuts 

Au debut, tout se faisait sans ordianteur, jusqu'^ la simulation manuelle du fonctionnement des 
algorithmes. Voici Tint^rftt de ce propos pour le thfeme du colloque : les algorithmes etaient formules 
en langage maison, une sorte de version en frangais courant d'un langage de programmation non- 
identifie. 

TABLEAU 5 
Un programme en langage «maison^ 

A, B > addition > C (= A + B) 

1. a£sisner une valeur & A 

3. assigner unc valeur h B 
S. toustraire 1 de ^ 

4. additionner 1 & C 

5. v^rinar ti A est 6gal h tizo 

« oui, aller k 6 
si non, aller k S 

6. soustraire 1 de g 

7. additionner 1 & C 

8. verifier si B est ^gal k zito 

si oui, aller & 9 
a non, aller h 6 

9. alHcher la valeur de C 
10. arr^ter 

Sans pretendre qu'il repondait k toutes les attentes, le langage «maison» fonctionnait. Les 
evaluations de cours faites par les etudiants montraient un taux de satisfaction qui m'etonne encore. 
Heureusement qu'on ne mesurait pas le taux de frustration dO au fait qu*on ne disposait pas d*ordi- 
nateurs. 



2.3 Le cours avec micro -ordinateur 

Avec rintroduction des micro-ordinateur^, le cours a evoluc, impliqua:^ Tapprentissage du 
BASIC et Tobstacle du jargon en anglaL. La solution a ete de continuer i decrire les algorithmes en 
frangais en deux etapes dans les premieres semaines de cour? : une etape pour presenter Talgoi Jbrne 
dans ses grandes lignes en vue d'une comprehension globale, suivie d*une representawon plus deti^illee, 
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suivant les lignes de I'eventuel programme en BASIC. Ensuite, on presentait le jargon precis pour les 
instructions BASIC, Au besoin, le code pour la commande etait jusLfie p r les termes anglais, par 
exemple LPkJNT vieni de line printer et fait imprimer ligne par ligne. 

Ainsi, nous avons combine une presentation en frangais avec le cede autonome q»'fcst le langage 
de progrunmation. La formule s'est averee satisfaisante pour les objectifs du cours et n'a pas sou- 
ley6 de rcjet general k cau^e de Tutilisation de I'anglais pour le langage de programmation. Uae 
mmonte ne reussissait pas i 0 valer la couleuvre, mais il est difficle de faire le partage entre Tanglais 
et la programmation corame sources de difficulte. 

II y a plus important que le langage de programmation en tant que tel : la langue utilisee dans 
la documentation. Les 6tudiants resistent A lire, mfime en frangais, et nous en avons des preuves 
convaincantes : les flches d'emprunt des volumes deposes A la bibliotheque pour le cours sont presque 
vierges. En ce qui concerne la lecture en anglais, certains etudiants et 6tudiantes admettent fran- 
chement leur inaptitude. Quant aux manuels et guides, il s'agit d'un genre litteraire assez special, et 
le probleme est surcompose. 

Evidemment, I'ideal serait de tout avoir en frangais : langage de programmation, sys- 
tfeme d*exploitation, gufdes, manuels et lectures d'appoint. Pour un cours d'initiation, c'est maintenant 
une possibihte. Le choix de langage est phis limite, mais il suf fit d'un seul dans la gamme appro- 
pn6e : TURBO-PASCAL pourrait remplacer le BASIC. 



3. Les avantages du fran^ais 

Revenons^ naintenant au sujet des avantages en faveur du fran?ais dans le monde de IMnforma- 
tique. La position adoptee sera claire. Un certain nombre de c'esavantages ont ete evoques ci-dessus, 
qui sont plus ou moins difficiles k evaluer. II y a une contrepartie, dont la port6e exacte est egale- 
ment difficile 4 apprecier, II peut ne pas exister de solution generate, valable pour toutes les situa- 
tions : qu'on pense aux ordinateurs centraux par opposition aux micros, aux divers niveaux scolaires, 
k la division entre informaticiens piufessionn^**^ et utilisateurs de I'informatique. Les choix sont 
ultimement des choix de societe et comme tels impliquent des decisions politiques. De telles decisions 
doivent Stre prises en considerant les coQfs et les benefices, aussi difficile que ?a puisse 6tre. 

Le debat autour de la francisation doit certainement faire une large place Si des considerations 
d'ordi'e social. Les besoins de communication k Tinteriear d'une societe sont evidents. La voloate de 
cohesion peut entrainer celle de la preservation d'un rOle preponderant pour la langue dans tous les 
domaines d'activite. Sans s*eterniser 14-dei us» tirons plutdt un argument d'une experience d'initiation 
des etudiants et etudiantes k Tinformatiqus en linguistique. Cette experience conduit a un constat 
qui constitue un argument prevalant sur tous les autres dans des contextes comparables. Ce constat 
est le suivant : certains Etudiants et etudiantes francophones ont moins de difficulte k s'initier a 
rinformatique en fran?ais. L'exigence du recours k I'anglais constitue un obstacle pour une partie de 
la clientele. Si cela est vrai des etudiants et etudiantes universitaires en Lettres, Test d'autant 
plus pour lu population en general. 

Cette conclusion est d*une evidence telle, que Ton serait en droit de croire que nous perdons 
notre temps k la prorlamer. Mais elle a des corollaires un peu moins evidents. L'aspect ie plus 
important pour Taveiiir de la societe est celui de Taccessibilite de Tinf ormatique, qui se doit d'etre la 
plus large possible. Toute limitation de I'acces tendra k nuire au develop- *ment economique, tout en 
exacerbant les inegalit6s sociales. Si le fait de promouvoir rinformatique en f rangais permet en meme 
temps de renforcer la position de la langue fran^aise, tant mieux. 



L»INFORMATIQUE EN FRAN^AIS^ 

Conrad Ouellon 
»angues et linguistique 
Universitd Laval 



Introduction 

La question du frangais dnns rinformatique est apparentce au probleme du frangals langue de 
travail, mais elle le d6borde puisque rinformatique s'est maintenant infiltree dans bien d'autres sec- 
teurs de notre activity. 

L'innovation technolog:que, regie g6n6rale, est en soi image de la societe dans laquelle elle s'est 
d'abord implantie. Elle reflite dote i des degr6s divers les valeurs culturelles de la societe dont elle 
est issue. L'importation de nouvelles technologies, dans des contextes particutiers, favorise certains 
transferts culturels; de fagon plus particulifere, elle est aussi susceptible de modifier les comporte- 
ments linguistiques de la soci6t6 importatrJce, la langue se trouvant dtre Tun des modes privilegies 
d'expression de la culture. 

Si la nouveile technologie ne deborde pas les limitts d*un laboratoire ou d'une usine, les conse- 
quences du changement ne prfttent peut-fitre pas k consequence, II en est tout autrement si on 
considfere le cas de rinformatique. La societe qui sMnformatise tend, en effet, i le faire i tous les 
niveaux ou presque, et dans toutes les spheres de son activity. 

La society queb6coise, de par sa position g6ographique, est une enclave dans un monde anglo- 
phone et les technologies de iMnformation lui viennent principalement des 6tats-Unis. En conse- 
quence, rinitiation t rinformatique s*est d*abord faite en anglais, i travers les premiers manuels et 
guides d*utilisateur; les informaticiens et autres specialistes de rinformatique travaillaient avec une 
terminologie anglaise. Cettc terminologie etait aussi omniprd' ^nte sur les pieces d*6quipement, les 
touches de clavier, dans les manuels et, 6videmment, dans les langages de programmation ... 

Cependant, ^ cause justement de la generalisation de rinformatisation, il se dessine de plus en 
plus une volont^ nette de la rendre accessible en franjais. Sans nous attacher aux raisons d'ordre 
politique qui justifient un effort p.us grand de francisation de rinformatique, nous nous placerons 
plutdt du point de vue des avantages que la societe quebecoise peut en retirer sur les plans de la 
productivity et de la quality de rexpertise qu*il est possible de divelopper au Quebec. Pour plusleurs, 
ces arguments valent plus que les autres et on peut le comprer.dre. Cependant, tout devient politique 
en conclusion. 



Etat de la question 

II semble important d6s le depart de faire la distinction entre la lar^.ue en usage dans les gros 
systfemes informatiques et ceile qu'utilise le monde de la micro- informatique. Que les gros systemes 
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invisibles i tous, sauf aux analystes et aux progiammeurs, fonctionnent avec du logiciel anglais et du 
mat6riel de support dans la mfime langue ne derange gufere pour Tinstant, compte tenu de la situation 
d'urgence qui prevaut ailleurs. Toutefois, les micro-ordinateurs, peu iraporte ieur usage, devraient 
communiquer en franfais avec les personnes qui les utilisent et tout le support devrait fitre fourni 
dans cette langue. Le mfime principe devrait prevaloir pour les systfemes de communication ontre les 
micro-ordinateurs et les systfemes centraux. Brcf, une technologie qui se veut i I'avanc-garde de 
plus en plus i Tecoute de I'util iteur devrait se pHer ^ un premier grand principe qui veut qu'un 
travailleur ait le droit de travailler dans sa langue mate^neUe, ici le fran9ais. II ne parait pas non 
plus ins8ns6 de penser que c'est i la machine i s'adapter & son utilis^iteur et non rinverse. Cest 
une question d'ergonomie, tout aussi importante que les precautions apporlees i la conception de 
Tameublement et ^ la quality des ecrans par exemple. 

peut penser, sans faire d'enqvidte, qu'un utilisateur d'informatique qui emploie sa langue 
maternelle mettra moins d' *emps i se former, ser moins sujet ^ des problfemes de comprehensicn 
des messages et sera par consequent plus productif. A la condiUon evidemment -:iu'il ne soit pas 
oblige de recourir i la version anglaise pour comprendre les messages qu'il re^oit ou les manuels qu'il 
consulte. Cette question sera abord6e plus lorn. II faut aussi signaler que le problfeme n'est pas le 
mfime selon qu'on parle de Tutilisation du frangais pour quelqu'un qui s'initie i Tinformatique en 
frangais ou pour quelqu'ua qui doit migrer d'un environnement linguistique anglais ^ un autre en 
franfais. 

A rheure actuelle, la situation semble varier consid6rablement. Voici, i titrc d'illustration, 
quelques exemples qui font clairen: nt ressortir qu'il est possible de travailler en fran^ais avec un 
ordinateur. 

a) Une compagnie d'assurance d'origine americaine comma La M^tropoIUaine a tenu, et reus-i, a 
fournir un environnement informatique enti&rement francophone ses employe;? queb6coi?. 
Qu'en r6sulte-t-il? Un haut taux de satisfaction des employes i peu pres tous u'^ \ -zz^^^^ fran- 
9ais et une productivity accrue dans une succursale recemment ouverte dans un : ^^oix du sad 
de Quebec, bien connue p^.ur <;on dynamisme. 

b) Un autre exemple est c .an de la Banque d*6pargn? de la Cili et du district de 
Montreal, qui a termini la francisation de son systime informatique. On note dans un rapport 
depose en octobre 1986 le taux eleve d? satisfaction des usagers, mais on y souligne aussi le 
coOt i payer pour Tinstitution. 

c) Plusieurs systftmes informatiques en usage dans les services gouvernementaux, dans les centres 
hospitaliers, fonctionpent 6galement en fran?ais. 

Les exemples de ce type de reussite sont nombreux. II semb?e bien que les societes qui le 
veulent possfedent un service informatique en frangais. Elles en retirent une meillleure ..nage et font 
volontiers 6tat, avec raison, de leur respect envers leurs travailleurs et leur clientele francophcmes, 
elles font ^ peu pres toutes valoir un fort taux de satisfaction de leurs employes. 

A Tappui de ce qui precede, un rapport du Comlt6 Canada-Qu6bec (forme pa les ministeres des 
Cjmmunicaions des deux paliers de gouvernement), sur le developpement du I^SiCxel d'expression 
frangaise (1986), signale aussi les inconvenients ^ travailler Jans une aut' langue : «Des etudes ont 
demontre que les logiciels con?u5 en anglais ddsavantagent les utilisateur% francophones dont Taci^es 
aux techniques nouvelles se trouve ainsi freine. Le plus souvent amptic .ins, ces ICaiciels sont mat 
adaptes k la reality des groupes francophones. 11 en rerulte une perte d'identite culturelle ei de 
maitrise linguistique». {Rapport du Comite Canada-Quibec sur le developpement du logiciel d'expres- 
sion frangaise 1987:3). 

II faut toutcfois reconnaitre que les PME, et evidemment les particv!iers, qui n'cnt pa5 'e«^ 
moyens d'investir dans la francisation, eprouvent des difficultes de divers ordres . 
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a) impossibilite d*acquerir les versions recentes des logiciels d'usage commun en frangais (ex. Word 
Perfect 5*0 disponible en anglais, pour la version frangaise un an plus tard); 

b) difficulte sinon impossibilite d*acquerir plusieurs logiciels, qui ne sont pas distribues sur le 
marche francophone; 

c) agacement devant les traductions boiteuses et mSme devant les traductions en fransais hexa- 
gonal, ce qui pose la question de la norme du frangais; 

d) difficultes de comprehension des manuels d^utilisation et des guides d*entretien en anglais. 

La consequence est le recours au materiel anglais pour ceux qui connaissent suffisamment cette 
langue, les francophones unilingues devant se contenter d*un materiel desuet dans plusieurs cas. 

Quelles sont les reactions possibles de Tutilisateur devant ces faits? Elles sont iiversifiees. Un 
professeur d'inf onnatique manifestait recemment son indifference totale devant ces problemes. Forte 
reticence egalement de certains ministeres du Gouvernement du Quebec qui soutiennent qu*on ne doit 
pas sacrifier la rentabilite au francais. La reticence est encore plus forte chez ceux qui sont deji 
habitues ^ travailler en anglais; nous ne citerons qu*un seul exemple, celui des servi :es informatiques 
d*une certaine universite qui distrlbue encore des manuels anglais pour la formation ^ certains logi- 
ciels alors que la documentation frangaise est disponible (ils le font ^ la demande, bien souveut, des 
usagers). 

Plusieurs utilisateurs reagissent autrement et exigent '*inf ormatisation en frangais. La demande 
est de pins en plus forte et c*est en tant que consommaieurs que plusieurs demandent i 6tre servis 
dans leur langue ... 

Existe-il des perspectives d'ameliorction? Evidemment, il en existe, et nous nous y attarderons 
maintenant Dans le contexte de conwu?rence feroce qui s*est developpe dans le monde de Tinfor- 
matique, c*est le client qui a raison, qui aura ce qu*il exig'?. Un repiesentant de la Society IBM 
Taf fLmait sans aucune hesitation ^ un colloque en fevrier 1988. (II disait aussi que sa societe avait 
consulte recemment un groupe d^experts francophones (region de Montreal) sur Tinter^t qu'il y aurait 
^ traduire plusieurs logiciels tres populaires en Amerique de Nord; on a repondu que ce serait una 
perte de vemps et qu*on pouvait tres bien se contenter du produit anglais ...). Une chose est cer- 
taine, les grandes oocietes sont plus sensibles qu'on le croit souvent a la pression des consommateurs 
et i leur image de bon citoyen; et surtout, Mies sont bien placees pour forcer les produ^teurs de 
logiciels comme Microsoft, Ashton-Tate, etc., ^ tenir compte des exigences des consommateurs. 



Problfemes rencontres par les utilisateurs francophones 

De fagon concrete, qujls sont les problemes que rencontre Tutilisateur francophone, ou plua 
generalement no.n-anglophone, en informatique? En voici quelques-uns, sans pretendre qu'Ils solent 
tons de la mfime importance. On peut s*entendre pour dire qu'ils relevent de trois aspects de Tinfor- 
matique : Tequipement, les logiciels, les manuels. 



I- Les claviers: il y a bien sQr la multiplicite des claviers. On peut dire que le probleme est le 
mSme pour Tensemble des utilisateurs. II n*est cependant pas du mdme ordre pour tous. L' an- 
glophone est moins touche puisque les 10 chiffres, les 26 lettres et, dans une moindre mesure les 
signer de ponctuation, occupent toujours la mdme place sur le clavier. Le francophone, lui, est 
aux prises avec la question des accents tres frequents en frangais, des accents qui doivent 
apparaitre sur ies majuscules aussi (Regies typojraohiques des editeurs frangais 1975). Ces 
accents sont tous produits, quand on le peut, par des frappes doubles. De plus, ils n'occupent 
pas toujours le mdme emplacement sur les claviers, forgant mSme k Toccasion le deplacement de 
caracteres ailleurs sur le clavier, d*ou Tembarras pour les utilisateurs. 
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Inutile de mentionner que la situation est la mSme avec las machines k ecrire convention- 
nelles. De plus, une sorte d'anarchie dans la conception du materiel infonnatique oblige k 
configurer imprimantes et ecrans pour que les caracteres soient vraiment accentues sur ces deux 
types de pdripheriques. Ce pourrait 6tre un mal encore acceptable si le fait de ne pas recon- 
naitre les accents comme de veritables caracteres en frangais ne cr6ait pas des problemes encore 
plus serieux dans le tri de documents et la recherche d'information dans les textes. Par 
exemple, du et dH sont consideres comme un m§me mot du point de vue de la 
langue anglaise. Un programme de recherche qui ne tient pas compte de Taccent devient diffi- 
cilement utilisable pour un francophone. Autre difficulte pour les caracteres supportes 
par les claviers : la distinction entre les ligatures ce et oe et les diphtongues ae 
et oe ne pent se faire {boeuf et coefficient ...)• 

Enfin, on identifie le plus souvent les touches en langue a^iglaise: delete, escape, insert, 
scroll, break font maintenant presque partie de la langue courante. 



2- Les logiciels. lis sont souvent en anglais, it moins qu'on appartienne k use grande organisation 
qui a les moyens et la volonte de les franciser. Souvent, ces logiciels ne sont pas en mesure de 
faire convenablement des operations de tri ou de classement alphabetique en frangais (la version 
assez recente de DBase-lll-f ne le pouvait pas). 

Les analyseurs de texte, les lemmatiseurs sont souvent con?us pour Tanglais et ne peuvent 
guere rendre service en fran?ais. 

Les lecteurs optiquej> en mesure de decoder les accents sont encore peu nombreux et coa- 
tent plus chers. 



3- Les manuels. lis sont souvent mal traduits. Les traductions faites en France agacent aussi les 
locuteurs francophones nord-americains. Les principaux problemes rencontres sont la polysemie, 
les ambiguTtes, etc. 11 se fait quand mdme de plus en plus d'excellentes traductions. Une 
societe comme IBM investit suffisamment dans ses services montrealais de traduction et de 
tenninologie pour obtenir des produits interessants. 



Solutions possibles 

Sxiste-t-il des solutions aux problemes qu'eprouvent les utilisateurs francophones? La repon^e 
est affirmative, on ne psut guere en douter. 



a) En ce qui conceme fequipement, on constate qu'il s'etablit certains standards. Les pas qui 
restent k faire pour qu'on s'entende sur i modele uniforme de clavier, du moins en Amerique 
du Nord, sont moins grands qu'on pourrait le croire. II en est tout autrement des codes ASCII 
et EBCDIC qui sont probablement li encore pour longtemps, mais qui ont la caracteristique de 
limiter le rcriibre de caracteres disponibles. II n'y a pas de grands obstacles i ce que les accents 
soient consid6res comme de veritables caracteres pour des fins de tri et de recherche. Plusieurs 
compagnies le font. 

La francisation des touches constitue peut-Stre un faux probleme; il suf f irait probablemeui 
qu'il y ait concertation sur un choix d'icdnes pour representer les diverses functions. On a bien 
reussi i s'entendre sur une representation «internationale» de la signansation routiere! Une 
forte pression de la clientele devrait permettre qu'on finisse par avoir raison sur ces points. 
Certains claviers recent^? affichent d'ailleurs leurs fonctions en langue frangaise. 
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b) Le probleme que posent les logiciels est d*un autre ordre. Cest probablement dans 
la modularisation que reside la solution. Au lieu de s'attacher i produire des logiciels uni- 
lingues, il faudrait peut-etre carrement aller vers la conception de logiciels multilingues. 
Un logiciei multilingue serair constitue d*une base de programmation en f rangais par exemple, 
alors que toutes les autres fonctions imaginables, les messages i Tecran, les fonctions de tri, de 
recherche, les donnees speciales coinme la fagon d^ndiquer la date, Theure, les systemes de 
mesure, etc., pourraient constituer la matiere de plusieurs modules interchangeables faits en 
fonction de clienteles de culture et de langue differentes. Des logiciels ainsi construits, et il en 
existe d6ja parait-il, feraient sQrement une forte concurrence aux logiciels unilingues. Cest 1^ 
un des champs ou nous pouvons transformer en avantage notre position de minoritaires du point 
de vue linguistique. II ae serait en effet pas toujours avantageux de construire des logiciels en 
langue frangaise au Quebec. Le marche est restreint et il ne faut pas compter sur la France 
pour rentabiliser le produit. D'un autre point de vue, nous sommes dejk habitues (trop diraient 
certains) a tenir compte de la presence de gens parlant d'autres langues. On voit facilement le 
marche qui s*ouvre au logiciei multilingue. En effet, il n'y a pas que le Quebec qui subisse la 
pression asslicisante de Tinfonnatique. Cest vrai de tous les pays ou Tanglais n*est pas la 
langue officielle. Cest m§me vrai de la Grande-Bretagne qui n*accepte pas toujours Tusage 
americain. 



c) Enfin, il reste la question des manuels ct guides en langue anglaise. II faut les exiger en 
langue frangaise et on peut souvent les obtenir dans cette langue. 0.n est cependant en droit de 
s'interroger sur la quality de cette traduction, bien qu*il faille reconnaitre sous ce rapport les 
efforts des grandes societes. Les services linguistiques montrealais de la Soci6t6 IBM fournisseat 
des traductions ou adaptations en excellent frangais. Gignalons cependant qu*elle ne partage pas 
necessairement ses travaux avec la Soci6t6 IBM- France, reconnaissant ainsi certaines divergences 
entre les fagons frangai?e et quebecoise de s*exprimer, ce qui n*est pas surpr^nant, puisque les 
cultures sont differentes. L*une des fagons possibles de regler ce probleme de traduction, serait 
peut-§tre de faire produire ces manuels en frangais au depart plutdt que les traduire. La tra- 
duction entraine aussi des frais enormes et des retards dans la mise en circulation des logiciels; 
on parle de retards de Tordre de neuf mois ... 

On le voit aisement, il n*existe pas de solution facile i tous les problemes qui ont ete souleves. 
Les veritables solutions relevent d*un effort soutenu de la recherche linguistique. 



Recherches k envisager 

II faudra resolument s'attacher a definir une forme de frangais ecrit et parle en 
vue de son usage par Tordinateur. D'une certaine fagon, comme le disait Richard Parent (ministere 
des Communications) dans une allocut.^n prononcee en mai 1986, «la langue frangaise a besoin d'etre 
reconstruite dans Tespace electronique a divers niveaux (grammaires, reseaux semantiques, regies de 
dialogue, etc.)» (Parent 1986:6). 

n est de la plus haute importance, pour les usagers francophones de Tinformatique, que leur 
langue puisse Stre aussi bien traitee par Tordinateur que Tanglais, d'oi: la necessite de disposer de 
descriptions de la langue realisees k ri.ntention des ordinateurs, comme les dictionnaires ont ete faits 
pour les humains. 

En href, il faut en arriver i definir une version formalisee du frangais dont les rapports avec le 
frangais habituel seraient du mdme ordre que ceux qui existt^nt entre Tanglais informatique et Tan* 
glais courant. Ce sont des langues techniques dont le seul merite est de faire obeir une machine. 
Une telle forme de langue pourrait probablement se prdter k la traduction automatique entre autres 
avantages ... Si Ton considSre que Tinformatique envahit constamment h peu pres toutes les spheres 
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d'activites humaines, on mesure Tampleur de ce d6f i. Et les participants au Sommet des pays franco- 
phones de Quebec (septembre 1987) I'ont bien compris en proposant de favoriser les industries de la 
langue. Restent a voir les retombees reelles des efforts annonces, si jamais on parvient a se d6gager 
oes contraintes d'ordre politique. II faudra quand mSme travailler en collaboration avec les autres 
pays francophones, surtout la France, dans cette grande entreprise de «mise a plat» de la langue 
franfaise. Plusieurs chercheurs et de nombreuses entreprises s'y interessent de plus en plus. Au 
Qu6bec mSme, des centres de recherche comme Ic CRIM (Centre de recherche en infonaatiqiie de 
Montreal) et le CCRIT (Centr; canadien de recherche en informatisatioa du travail) a Montreal, le 
CEFRIO (Centre francophone de recherche en informatisation des organisations) et le CIRB (Centre 
international de recherche sur le bilinguisme) a Quebec, y travaillent en collaboration avec les ser- 
vices gouvernementaux et les industries. 

L'informatique en frangais? Oui, sans aucune hesitation. Cest le droit legitime de travaille-- 
dans sa lansae d'usage qui est en jeu. Du point de vue des organisations, le recours a la langue 
matemelle en informatique est sans aucun doute interessant du point de vue de la productivite II 
est sOr qu'il y a des coQts pour f ranciser l'informatique. Cependant, si I'operation est roenfie de fa?on 
methodique et de concert entre tous les intervenants, de disciplines diverses et d'organisations va- 
ri6es, ce qui semble un handicap au premier abord peat permettre de bAfir un secteur d'excellence 
permettre par consequent de d6velopper une expertise «exportabIe». 

Enfin, il y va peut-Stre de la survie mSme de la langue frangaise de prendre tous les moyens 
pour qu'elle serve d'outil de communication entre les personnes, mais aussi entre les personnes et la 
machine, et peut-Stre aussi de machine a machine ... Comme le disait Bernard Cassen, chef pour la 
France de la Mission Industries de la langue : «0n pent ... dire que les langues qui ne s'industria- 
hsent pas cesseront t un terme plus ou moins bref, d'Stre v6hiculaires, parfois mftme, dans d'impor- 
tants secteurs d'activites des pays oii elles sont parlees» (Cassen 1986:13). 
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La presente communication fait etat de Tavancement du pro jet de recherche sur la syntagmatique 
terminologique en informatique du departement de Langues et Linguistique de Tuniversite Laval, qui 
commence sa deuxieme annee. L'equipe est composee de Jean-Claude Boulanger et Dorothy Nakos, 
professeurs responsables, et da deux etudiants au niveau de la maitrise en terminologie et traducticu. 
La recherche consiste k faire une etude comparative de la structure et du mode de formation des 
syntagmas en anglais et en frangais. C*est une tiche de grande envergure qui explore un aspect 
fondamental de la terminologie. Est-il besoin de rappeler que la proportion de syntagmes dans le 
vocabulaire des langues de speciality est generalement evaluee h pres de 85%? De par son caractere 
descriptif , le sjTitagme est un moyen privilegie de nommer la grande quantity de nouvelles realites qui 
apparaissent quotldiennement. 



Af in d'eviter toute confusion, signalons la definition du syntagme tel qu*on le conuait en termi- 
nologie. II s*agit d*un groupe de mots d*au moins deux unites linguistiques. syntaxiquement liees, qui 
fonctionnent comme une unit6 simple, Ce signifiant ne denomme qu'nn et un seul signifie, dans un 
domaine donne de la connaissance humaine. Cette definition sMnspire de Jean-Claude Boulanger 
(Boulanger 1988:22). 



Le «syntagme» en terminologie s'eloigne de la notion de syntagme utilisee en linguistique. 
Syntagme n*est que Tun des 25 termes releves par Rostislav Kocourek en 1979 pour denommer cette 
notion. Entre autres, Benveniste parlait de synapsie, Pottier de lexie complexe. Auger de mot com- 
plexes Phal preferait g/'oupe de motSy Hollyman, denomination complexe et Rey, groupe lexicalise. 



La bibliographie analytique constituait la premiere etape du projet. C'est un volet plutdt mineur, 
qui de tcute fagon a ete presente au dernier colloque IBM-Laval en novembre 1987. Cette biblio- 
graphie est presque terminee. Pres de deux cents ouvrages de tous genres ont ete depouilles : actes 
de coUoques, articles de psriodiques, monographies, etc. Les ouvrages retenus ont fait Tobjet d'un 
article. Chacjue article contient une reference complete, des descripteurs et un resume de Touvrage. 
Les 75 articles retenus en sont au stade de la revision et devraient faire Tobjet d*une publication i 
la fin de Tannee. Initrulement consignee sur le logiciel BIBELO, la bibliographie a ete convertie sur 
le logiciel de traitement de texte WordPerfect en vue de la publication. 



Par ailleurs, un corpus frangais a ete constitue afin de mettre au banc d'essai les theories 
recens6es dans la bibliographie. II est constilue de trois ouvrages publics par TOffice de la langue 
fran9aise du Qu6bec. II s*agit de : 



Comtnunieation prtwnt^e Ior« du 56® Congri'j d« I'ACFAS, Moncton, 9-13 mai 1988. 
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M Termtnologie de rinformatigue^ paru en 1983; 

« Vocabulaire du logicieL paru en 1987; 

B Vocabulairft du micro-ordinateur . paru en 1986. 



Le corpus contient plus de 6 000 termes, emmagasines sur un support informatique a I'aide du 
systeme de gestion de base de donnees dBase III+. La banque de donnees linguistiques IBMot, fournie 
par les Services linguistiaue>i de la Society IBM Canada Lt^e, sert de corpus de reserve. 

Chacun des 6 000 termes figure dans cinq bases de donnees, ou fichiers. Chaque fichier repond 
& un besoin d'analyse particulier soit : 



Cest celle-ci qui nous interesse, car le projet visait avant tout Tetablissement d'une typologie 
renouvelee des syntagmes et I'etude de leurs modes de formation. 

Cest d*ailleurs un projet qui ne manque pas d'interet. La derniere - et la premiere - typologie 
des syntagmes a ete etablie par Louis Guilbert, il y a plus de vingt ans. Depuis, personne ne s'est 
vraiment penche sur la question. 

II s'agit de reviser et de completer la typologie de Guilbert. Ce dernier recensait six formes de 
syntagmes : 



1- Norn + adjectif 

ex. : ■ menu d^roulant 

■ spuria optique 

2- Adjectif + nom 

ex. : ■ hautft definition 

3- Nom + joncteur pripositic .ael + nom 

ex. : ■ archivage en caractfere 
m num^riseur k cyHndre 

4- Nom + joncteur pr^positionnel + pr^d^terminant + nom 

ex. : ■ guide de Top^rateur 

■ profil c rutiligateur 

5- Nom + absence de joncteur + nom 

ex. : 6 carte param&tre 



L'etat actuel des recherches indique que ce nombre pourrait 6tre augmente a peut-etre une 
dizaine, douze tout au plus. 



■ lei signes diacritiques (tiret, apostrophe, guillemetf , barre oblique, etc.): 

■ les propositions, ou joncteurs (nombre, sens, frequence de chacun, etc.); 

■ les caract^rei morphologiques (emprunt, sigle, mot-valise, etc.); 

■ les renieignements gOniraux (variante orthographique, synonyme, abrOviation, etc.); 
a et, finalement, I& typologie. 



■ fichier article 



6- Nom + joncteur prOposifeionnel + verbe 
ex. : ■ machine k calculer 
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La recherche a revele jusqu'^ maintenant Texistence de modeles differents. Par exemple, on 
releve la presence de pronoms relatifs (circuit 5 dont 2), de conjonctions (regulation proportion- 
nelle, integrate et derivee) et d'adverbes (recepteur seulement). II faudra trancher : ces syntagmes so 
reduisent-ils aux modeles avances par Guilbert? S'agit-il de nouveaux types? Ou encore de formes 
fautives, de termes simplement mal construits (du type auto-ldve^ depuis remplace par iave-auto)! 

Chose certaine, Teconomie de la typologie sera privilegiee. Pour certaines ecoles, un syntagme 
long de plus de vingt mots pourra representer un modele k lui seul (nom + adj + prep, + nom + prep, 
-hadj-h nom^ etc.). Ainsi, systeme de gestion de base de donnees peut 6tre considere comma un syn- 
tagme du genre nom + prep. + nom + prep. + nom + prep. + nom. Cependant, les chercheurs du projet 
avancent une 1- ypothese, dite de «neutralisation», qui reste ^ verifier. Selon leur conception, le meme 
syntagme serait considere comme correspondant au modele nom + prep. + nom. En eff et, un «systeme 
de gestion» pouvant dtre determine par autre chose qu'une «base de donnee: s le syntagme est decom- 
pose comme suit : 



FIGURE 1 



systeme de gestion 

n + p + n + 



fonction nominale + 
n + 



de baae de donnees 

p + n + p + n 



p + fonction nominale 
p + n 



Cette recherche amene i poser des questions cupitales ; qu'est-ce qu'une notion ? Un adjectif 
constitue-t-il une notion k lui seu! ? Doit-il figurer k ce titre comme entvee dans un vocabulaire ? 

On trouve par exemple dans le corpus Tentroe a bascule. On peut penser qu'il s'agit d'un 
nouveau modele, prep. + nom^ auquel n'avait pas pense Guilbert. Mais s'il s'agissait de quelque chose 
d'incomplet en soi, si ce n'etait pas une notion? De toute fagon, le terme ne sera-t-il pas necessai- 
rement repris dans Tentree du nom qu'il qualifie ? Si tel est le cas, il deviendrait inutile de le faire 
figurer seul en entree, sauf si on le considere comme un modele. 

Par ailleurs, d'interessants problemes sont souleves en ce qui a trait aux prepositions. Par 
exemple, DOS est rendu de trois fa?ons en frangais : 



1- systfeme d't^yploitation de disgues (prdp. de) ; 

2- systeme d'<iXploitation k diggues (pr6p. k)\ 

3- systfeme d'expioitation disgues (absc "ice de proposition). 



En plus de la difference de modele entre le derniei syntagme et les deux premiers (nom t 
absence de joncteur + nom par rapport k nom + prep. + nom), on note une difference complete de 
sens entre systeme d*exploitation a disques et systeme d*exploitation de disques. En effet, la prepo- 
sition rfe signifie dans ce contexte «systeme qui exploite des disquebw tandis que le joncteur a renvoie 
ii ridee que le systeme exploite Taide de disques». 

Ce qui precede est un bref apergu des nombreuses questions qui :e posent au debut meme de 
Tanalyse. II en existe piusieurs autres. Toutes ne sauront etre resolues pai Tetude entreprise car un 
choix s'impose, etant donne Tenvergure des recherches. Mais le fait m^me qu'elles soient posees est 
en soi un signe de progres. 
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Les resultats de cette recherche serviront t poser des jalons pour la creation judicieuse et 
appropnee de syntagmes. La typologie retenue devrait en principe etre applicable i tous les doinain*>s 
de speciality. 

Dans una optique traductionnelle, il existe qaatre possibilites de rendre un terme anslais en 
f ransais : 



■ terme simple B [input] 
terme simple F [intrant! 

Ce n'est cependant pas I'objet de notro ^tude. 

a terme simple B [indexing! 

teme syntagmatique F [recherche index^el 

a terme syntagmatique B [information p'^ocessing industrvl 
terme simple F [informatiouel 

■ terme syntagmatique B [initial program loader! 

terme syntagmatique F [pr(<!^dure de chargement initial . 



La typologie sera utile aux «fabricants» de lexiques et de vocabulaires en approfondissant le sens 
des syntagmes, en precisant le sens des prepositions, leur frequence d'utilisation, en fournissant des 
statistiques sur les modes de formation ainsi que sur les combinaisons interlangues, comme le demon- 
tre la serie d*exemples precedents. 

Le projet a des retombees interessantes qui seront brievement decrites ci-apres. 

Tout d'abord, en plus des deux professeurs responsables du projet, six etudiants et etudiantes y 
travaillent ou y ont travaille. 

^ La syntagmatique a egalement ete retenue comme theme de deux seminaires de terminologie i 
1 automne 1986 et k I'automne 1987. Les etudiants ont ete amends i se prononcer sur diverses facettes 
du syntagme par le biais d'exposes et de recherches appliquees. 

La sensibilisation i cet aspect fondamental de la terminologie a eveille chez certains le desir 
d'en poursuivre I'etude. En effet, quelques etudiants inscrits i la maitrise en terminologie axeront 
une partie de leur essai sur le traitement des syntagmes dans leurs corpus respectifs. 

De plus, ds nombreuses questions soulevees par I'etude demeurent sans reponse. Les corpus sont 
m, disponibles pour des recherches approfondissant Tun ou Tautre des aspects problematiques. 

Fait non negligeable, le projet debouche egalement sur la distinction entre le syntagme, le 
phraseologisme et la phrase. On passe alors «du terme au texte», pour reprendre une expression 
utilisee par Monique Cormier lors du Colloque sur Thistoire de la terminologie k Bruxelles en mars 
1988. 

En fait, on sait bien peu de choses sur le phraseologisme, si ce n'est qu'ii s'agit d'un groupe de 
mots ayant un sens donne, mais ne renvoyant pas necessairement i une seule notion et qu'il se situe 
quelque part en amont des collocations, des expressions et des locutions et en aval des termes et des 
syntagmes. Nous examinerons d'ailleurs la possibility de faire du phraseologisme le sujet de notre 
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essai de maitrise. Nos recherches beneficieraient alors naturellement de Texperience acquise avec le 
projet de recherche sur la syntagmatique en ce qui a trait au classement, k la definition, Tidentifi- 
cation, la typologie, etc. 

Le phraseologisne se situe ii une etape posterieure : on quitte alors le lexique, on se rapproche 
de la syntaxe. Llais avant de pouvoir le faire, il fallait pousser plus en profondeur les 
recherches lexicales, ce qui est maintenant en bonne voie. Les etudiants comme les professeurs 
travaillant au projet ont egalement eu Toccasion de presenter des communications sur le sujet. Ainsi, 
plus de huit conferences ont ete presentees en moins de neuf mois. La recherche en cours a egale- 
ment fait I'objet de discussions lors de recents colloques europeens. 

De plus, certains etudiants ont la chance d'effectuer des stages en entreprise, d'y rencontrer les 
utilisateurs de terminologie et de se frotter i Texercice pratique qui consiste i resoudre des proble- 
mes d'ordre syntagmatique. Un etudiant a pu contribuer t un aspect essentiel du projet en travaillant 
pendant une periode de trois mois au dictionnaire Le Robert, i Paris, t I'automr.e 1987. 11 a aborde 
le probldme du traitement du syntagme dans les ouvrages lexicographiques generaux, notammment le 
Grand Robert de la langue frangaise. 

A I'heure actuelle, nous effectuons un stage aux Services linguistiques de la Soci6te 
IBM a Montreal. II ne suf fit pas de parler de terminologie, il faut encore on faire. En contrepartie, 
de telles recherches permettent a Tentreprise de beneficier de retombees tant theoriques (lire resul- 
tats) que pratiques (lire formation du personnel). 

L'importance de toutes ces retombees merite d'etre soulignee car la releve est essentielle afin 
que le Quebec demeure le prdcurseur en terminologie. 



Jean Quirion 
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LE CENTRE D'ANA^iYSE DE TEXTES PAR ORDINATEUR (ATO) 
Un laboratoire de recherche spi6cialls6 
dans Tanalyse de textes par ordinateur^ 

Jules Duchasiel 
University du Qu6bec ^ Montr6aI 



1* Un Ceti^re d'analyse de textes par ordioiiteur (ATO) 
1.1 Bref historique 

La cr6ation du Cectre d'ATO esC le couronneroeut d*une d6ji longue experience do recherche en 
analyse de textes par ordiMteur 4 TUQAM. Les chercheurs r*** s*y adonnaient 6taient conscients de 
la pr6carit6 des ressources et de Tabsence de garanties de l'universit6 au sujet de la poursuite de 
leur recherche. II fallal^ iacite. celle-ci & reconnaltre Toriginalitd et la valeur de ces travaux dans 
un domaine de pointe, qui s*6taient spontan6ment d6velopp6s dans ses murs. En ef fet, k partir des 
ann6es 1970, uu petit groupe de professeurs-chercheurs et d*6tudiants de deuxifeme et de troisifeme 
cycles avaient entrepris de developper des syst^mes informatis6s capables de traiter et d*analyser 
rinformation textuelle. Au fil des ans, un nombre croissant de chercheurs se sont tourn^s vers ces 
systemes pour effectuer des recherches dans Jes disciplines aussi diverses que la philosophie, la 
sociologies les communications, la psychologie et la lin^aistique. 

Cest dans cc Cuntexte que Tuniversit^ du Qu6bec & Montreal a progressi\^ment trouve les 
moyens d*assurer une certaine stability des ressources humaines, logicielles et mat^jrielles necessaires a 
ce nouveau type d*activit6 de recherche. 



1.2 Trois siaiuis 

Ainsi, des octobre 1983, les chercheurs en ATO ont 6t6 officiellement reconnus comme 6tant un 
regroupement de chercheurs, ce qui leur permettait de financer Tembauche des premiers membres 
d*une iquipe d*analyj^tes-programmeurs et d'agents de recherche sp6cialis6s dans la manipulation des 
environnements informatiques. Le nombre de chercheurs n*al!ait cesser d*augmenter jusqu'^ ce jour : 
r^quipe comprend actuellement huit p^jrsonnes k temps plein. Cette cquipe constitue la premiere 
realisation du Centre. Les personnes qui la composent sont directement conf ront6es aux problcmes du 
d6veloppement informatique n6cessaire k tout projee, qu'li Emerge de T^quipe m6me ou des profes- 
seurs-chercheurs rattachds au Centre. L*6quipe s*emploie 6galement k la recherche et au ddveloppe- 
ment des environnements de programmation dans leur aspect g£n6ral, afin quMls soient utiles k tout 
genre d*applications futures. 

La seconde reconnaissance officielle est venue du Fonds pour la formation des chercheurs et 
Taide k la recherche (FCAR), organisme rattach6 au ministere de TEducation du Quebec, et qai of f re 
des subventions. En raison du caractere unique des activites du Centre, le FCAR lui a accorde le 




^Communication pr6«ent^ low de la Deuxiime Conference chefa d'fitat et de Gouvemement de payi ayant en 
commun ruiaee du frangaU, tou« le tb^mt : Indus tries de la langue, Quebec, 5 s^ptembre 1087, 
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statut d'Organisme de service a la recherche (OSR). L'aide f inanciere accordee dans le cadre de ce 
programme vise a permettre au Centre de fournir des services en ATO a tout chercheur subventionne, 
quelle que soit son affiliation au Quebec. Cela determine la seconde activite du Centre : d'une part, 
Taccueil, la formation et I'echange entre professeurs, chercheurs et etudiants grace a des activites de 
■communication (seminaires, colloques), des stages, la formation et le sejour au Quebec de chercheurs 
etrangers; d'autre part, la production de services techniques, le traitement de donnees, le soutien a 
I'elaboration de dictionnaires, de modeles d'exploration de donnees textuelles et d'analyse-expertise 
sur les projets en ATO. 

Enfin, depuis avril 1986, le Centre s'est vu reconnaitre le statut de laboratoire par I'universite. 
Ce statut a ete obtenu sur la base de I'existence d'une masse critique de professeurs-chercheurs 
oeuyrant dans un domaine de recherche unifie par une certaine problematique commune. Au Centre, il 
s'agit de I'interet porte aux strategies de description et d'exploration textuelles appliquees a des 
textes divers. Ainsi, I'originalite du Centre tient a son caractere veritablement inter-disciplinaire. II 
existe, en effet, une tres grande interdependance entre les aspects informatiques, linguistiques, cogni- 
tifs et discursifs dans le traitement et I'analyse du materiel textuel. Le Centre tente de soutenir 
cette complexite par des environnements informatiques «parametrablcs» par I'usagei, permettant ainsi 
d'accueillir plusieurs theories ou hypotheses portant sur Tanalyse textuelle. 



L3 Vobjet 

Le concept d'«analyse de textes par ordinateur» semble parler de lui-meme. Pourtant, cette 
question en souleve bien d'autres. Nous avons choisi cette locution parce qu'elle designait I'objet de 
notre recherche, le texte, et I'outil qui serait mis en oeuvre pour en produire I'analyse, I'ordinaterr. 
Mais le domaine englobant de notre activite est celui de la comprehension des langues naturelles. 
Nous avons choisi de circonscrire notre recherche a la langue fran?aise, et plus particulierement a 
I'etude des faits de langue dans les textes. Nous avons retenu comme objet le texte, qui n'est qu'un 
des supports de I'expression langagiere, parce qu'il se prete plus facilement t des manipulations 
informatiques en raison meme de son caractere plus formel. II i?xgL^ tout naturellement de la pre- 
miere etape dans la comprehension automatique du langage. D' autre cote, le texte represente 
egalement une difficulte certaine dans la mesure ou on procede d decryptage extensif dans des 
contextes reels, irn somme, notre objectif est de d-^velopper d^s systemes de comprehension de la 
langue applicables a des objets reels. 

Comprendre automatiquement la langue signifie qu'il faut «programmer des machines capables 

V* «n«^3ti ^...t^x/o««i^s . Awx^iK«x/*x/fi,iviMe, synraxiquc, scmant;quc, aiscursivc et irieme 

pragmatique». II faut done «apprendre» a la machine une certaine competence linguistique, mais aussi 
des competences quant a I'organisation du discours, aux modalites de la representation cognitive, de 
I'insertion sociale du langage, etc. 



1.4 Les domaines d'application 

En dehors des interets particuliers des chercheurs, on peut legitimement s'interroger sur la 
pertinence de I'ATO sur le plan social. Pour hs besoins de la cause, on peut facilement distinguer 
deux grands domaines d'application de ces recherches : les aides d, la lecture et les aides a Tecriture. 
II existe de plus en plus de fonds documentaires dans les milieux de travail. On y manipule une tres 
grande quantite d'information ecrite i laquelle il n'est pas toujours facile d'acceder. II s'avere inte- 
ressant de procurer une aide a la lecture de ce materiel. Voici quelques exemples. On peut souhaiter 
classifier I'in formation contenue dans des textes a partir des differents criteres syntaxiq jes ou seman- 
tiques qui permettraient, dans un deuxieme temps, d'acceder a Tinformation par des procedures de 
reperage qui tiennent compte de ces criteres. Ainsi on peut avoir acces a Tinformation non seule- 
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ment en partant de mots-cles, mais en recherchant des categories prealablement reperees dans le 
texte. De telles procedures, simplifiees par des routines traduites sous forme de menus adresses a 
Tusager, sont faciles ^ definir dans Tetat actuel de la recherche. On peut egalement appliquer des 
methodes d'analyse de contenu des documents h partir des protocoles de description et d'exploration 
dejideveloppes dans des recherches plus f^adamentales. L'utilisation de methodes d'anaiyseie textes 
pour la construction assistee de banques de donnees relationnelles constitue un autre exemple d'appli- 
cation. 

Les aides 4 I'ecriture peuvent se reveler tout aussi precieuses. Pour la redaction, on peut 
fournir un support lexical de nature orthographique en wonnant acces a des dictionnaires, a un conju- 
gueur ou encore, a ua support lexical ae nature remantique en recourant a des banques de donnees 
analogiques ou terminologiques. Le document redige, on a la possibilite d'intervenir de nouveau en 
fournissant un correcteur orthographique et grammatical, ou en permettant un exan;2n stylists, de 
Tecrit, par exemple en fournissant des indications sur le niveau de lisibilite. Un dernier type de 
systeme a trait au probleme de I'annotation, c'est-a-dire a la preparation de resumes et de thesaurus 
ou i rindexation automatique ou assistee des ecrits. 



2, Les environnementc' de programmation 
2.1 Trois systemes 

Le Centre a regroupe les deux analystes qui sont k I'origine de programmes informatiques pour 
Tanalyse de textes. Depuis sa reconnaissance off icielle, le Centre a favorise le developpement de ces 
environnements qui constituent I'infrastructure informatique des differentes recherches qui y sont 
menees. 

Le premier systeme, appele «Systeme d'Analyse de Texte par Ordinateur» (SATO), a ete deve- 
loppe principalement par Frangois Daoust, d'abord au sein d'une equipe animee par Jean- 
Guy Meunier, ensuite en fonction des besoins specifiques des chercheurs, il est maintenant developpe 
au Centre d'ATO. II s'agit d'un systeme interactif d'analyse de textes, specialise daus le reperage de 
concordances, la generation de lexiques et Tanalyse statistique descriptive des donnees textuelles. Le 
systeme permet la manipulation non seulement des mots du texte, mais aussi des valeurs de proprietes, 
symboliques ou numeriques, associees k ces derniers par Tusager. A partir d'une «syntaxe de requd- 
te», il est alors possible de produire des lexiques, des concordances et des dcnombrements de tout 
ordre. 

Le second systeme a ete elabore dans le cadre d'etudes de maitrise et de doctorat, et de 
nouvelles versions developpees en cours de recherche par Pierre Plante; ce dernier a ete direc- 
tement impliqu^. avec I'auteur dans la creation du Centre. Le Deredec est un langage de program- 
mation pour Tanalyse du langage naturel. II permet de representer les donnees aux divers n'veaux du 
fonctioanement linguisvique . lexical, morphologique, syntaxique, semantique et textuel. II permet 
egalement de decrire ces donnees sous forme de grammaires s'adressant a ces divers niveaux. II 
donne les moyens d'explorer ces diverses descriptions. Enfin, il est aussi utilise pour la mise au 
point de systemes k base de connaissances. Le Deredec est un cadre informatique general pour la 
programmation d'analyseurs ou simulateurs linguistiques bases sur diverses theories algorithmiques. 
On peut le considerer en premier lieu comme un atelier de travail pour les «informaticiens linguistes» 
et pour Tenseignement de leur discipline. Par ailleurs, il offre aussi toutes sortes de facilites pour 
Tutillsation des analyseurs linguistiques dans des applic ttions telles que les analyses de contenu des 
textes et les systemes-experts, qui questionnent les text3s comme des banques de connaissances. 

Grace t ses ressources, le Centre permet egalement d'effectuer de la recherche en vue de la 
mise au point de systemes-experts dans les domaines du diagnostic, de la classification et de la plani- 
fication. Ce systeme, developpe par Louis-CIai^dc Paquin, est programme en Deredec de telle sorte 
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que les structures utilisees pour la representation informatique des objets cognitifs sont compa- 
tibles avec celles de tous les systemes ecrits en D6redec. D6r^dec- EXPERT constitue ainsi une 
structure de contrdla ideale pour les systemes d'analyse de tex^es par ordinateurs. 



2.2 Les caracteristiques des systemes 

II est important de noter que les environnements de programmation developpes au Centre 
sont necessairement compatibles entre eux. D^redec offre une structure unique de repre- 
sentation des donnees, les EXFAD (Expressions de forme admissible au D^redec). Tout 
systeme ecrit en Deredec fonction"? avec des EXFAD ec produit ^ son tour des EXFAD. Cela 
permet une parfaite integration de toutes les descriptions ou explorations produites en Deredec et 
rend possible leur utilisation d'unv^ application k Tautre. Nous favorisons ainsi la double strategie de 
modularisation et d'integration. Nous develop jons les elements des systemes et les systemes eux- 
memes sur une base modulaire, nous assurant ainsi de leur productivity et nous sommes des lors eu 
mesure de les integrer sans modifier leur code. II existe une interface entre SATO et Deredec, qui 
rend possible le trausfert des donnees d'un systeme k Tautre. 



2.3 Uimplantation 

Le Deredec est ecrit en Le_Lisp et est compatible principalement avec Macintosh (Plus, SE, Mac 
II), Une version est aussi implantee sur VAX- VMS. D6redec-EXPERT est egalement compatible avec 
Macintosh (Pius, SE, Mac II). Enfin, SATO est compatible avec PC_XT- AT, VAX- VMS, Amdhal 
et est en developpement sur Macintosh. 



3« Les axes de developpement et de recherche 

II faut distinguer les axes de recherche, fondrmentale ou appliquee i des domaines, du develop- 
pement proprement dit des environnements de programmation. On pent facilement resumer les orien- 
tations du Centre en trois volets : les deux premiers sont de nature fondamentale et le troisieme, de 
la recherche app^'quee. Nous appellerons les elements du premier volet «Modules de Description 
Linguistique» (MDL) pour designer ^ensemble des programmes destines a la description proprement 
linguistique du texte avec Tobjectif L^accroitre le caractere automatique de la comprehension de la 
laiiguc. iNuuS rcgfOUpoos uauS Ic ScCOnd volet IcS umOuuIes uc RcpicSciiiaiion ucb Cunnaibsances el 
d*Inference» (MRCI). II s*agit des systemes consacres k la construction de bases de connaissances 
relationnelles sous forme de structures arborescentes et pouvant dtre Tobjet de Tapplication de proce- 
dures descriptives ou exploratoires en Deredec, ainsi que des modules d'inference, comme on en 
rencontre dans les systemes- experts. Le troisieme /olet, qui regroupe les «Modules d'Analyse de 
Textes» (MAT\ renvoie aux deux premiers parce qu'il utilise leurs modules en les combinant dans un 
systeme integre d*analyse de contenu assiste par ordinateur. 



3.1 Modules de description linguistique 
CBSF 

Le premier module est un algorithme de «Categorisation de Base Syntaxique du Frangais 
(CBSF), devoloppe au Centre par Lucie Dumas. II >'agit d'un progiciel qui reconnait automatiquement 
la categorie syntaxique de la plupart des forme^ lexicales de la langue frangaise. II constitue une 
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etape prealable k Tutilisation du progiciel de lemmatisation et de caracterisation morphologique dunt il 
sera question ci-apres. II est egalement necessaire au developperaeat ou i Tapplication d'analyseurs 
syntaxiques. CBSF travaille a partir d'un ensemble de* "6gles morpnc^ogiques et d'un dictionnaire 
d' exceptions. Une analyse morphologique permet d'ass^Caer la tenLinaison grat^hique d'unites lexicales 
h leur catSgorie syntaxique respective. Par exempie, \z suffixe --able correspond k des qualificatifs 
dans 1 380 des 1 432 formes qui se terminent ainsi en frangais. Notre dictionnaire repertorie 52 
exceptions k cette regie, pour lesquelles il :'af:it soit d'un nom, soi*. d'un nom/adjectif, soit encore 
d'un nom/verbe conjugal. II existe 250 regies semblables u le dictionnaire d'exceptions comprend 3 
000 entrees. Ce systeme arrive k categoriser entre 85% et 90% des mots d'un texte, selon son niveau 
de difficulte. Les mots restants regoivent, si desire, leur categorie en interactivite avec un operateur 
humain. Les travaux actuels visent k reduire cette proportion de mots qui echappent k la categori- 
sation et il est permis d'esperer une performance de I'ordre de 95%. 



LCMF 

Le progiciel de «Lemmatisation et Caracterisation Morphologique du Fran5ais» (LCMF) a ete 
egalement developpe par Lucie Dumas. H o*agit d'un programme permettant de regrouper automati- 
ruement autour d'un mSme lemme toutos les formes flexionnelles qui y sont associees. La notion de 
lemme dans LCMF se definit comme I'unite minimale de representation pour une forme lexicale don- 
nee, telle qu'elle se presente normalement dans un dictionnaire. Ainsi, par exemple, toutes les desi- 
nences verbales sont representees par I'infinitif et les formes flechies des noms et des adjectifs, par 
le masculin singulier (ou le feminin singulier pour les defectifs). Les adverbes sont representcs par 
I'adjectif masculin singulier leur correspondant (ex. la forme lemmatisee de brillamment sera bhllatit). 
En plus de ce travail sur la lemmatisation, LCMF foumit egalement une categorisation morphologique 
(genre, nombre, personne et temps) pour environ 90% des unites lexicales d'un texte. Ce pourcentage 
sera augmente dans une version ulterieure. 

La figure I illustre les elements d'information obtenus k I'aide de CBSF et de LCMF sur 
la phrase : Pour les reacteurs a neutrons, on dressera un bilan negatif. On y retrouve les categories 
syntaxiques pour chaque mot, le lemme pour les noms, le qualificatif et le verbe, ainsi que la cate- 
gorisation morphologique pour chaque forme lemmatisee. 



nGURE 1 
Sortie de CBSF et de LCMF 
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ALSF 



«L' Analysev.r Lexico Syntaxique du Frangais (ALSF) est un programme d*analyse automatique de 
frangais, developpe dans le cadre d'un projet de cooperation franco-quebecois de recherche univer- 
sitaire. Jean-Marie Marandin, de Tlnstitut national de la langue frangaise (INaLF), travaille sur la 
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partie linguistique et Pierre Plante, du Centre d'ATO, soutient la programmation. Cet analyseur 
constniit les structures syntagmatiques projetees par les categories majeures du frangais : les noms, 
les verbes, les adjectifs et les prfipositions. II constniit egalement les relations qu'entretiennent 
entre elles ces categories dans des unites sequentielles : les propositions, les phrases et les segments 
du texte. La strat6gie de developpement consiste k favoriser une complete modularite, theorique et 
computationnelle, favorisant Tapplication effective des niveaux de description attexnts et permettant 
rexpansion de la coquille initiale* II s'agit d'un analyseur qui doit executer son traiiement en regard 
de textes effectifi sans bloquer et sans produire d'anaiyses erronees pour les structures qu'il ne peut 
traitor. Des modules additionnels devraient pcuvoir ctre developpes en vertu de differentes hypo- 
theses linguisiiques. Scrit en DSredec, ALSF s'a^puie sur les sorties CBSF et LCMF et comportera 
des modules de surcategorisation^ 

La figure 2 presente la description syntaxique produite par ALSF de la mgme phrase que celle de 
la figure 1. 



FIGUiiE 2 
Scrtie d'ALSF 




3.2 Modules de representation des connaissances et d'mference 
SAGA 

Le «Systeme d' Analyse Grammatical Assistee» (SAGA) est avant tout un systeme permettant la 
construction d*une structure de representation des connaissances et Tinstanciation de cette structure 
k partir d'objets ^Is. Un SAGA se presente sous la forme d*un arbre de decision contenant des 
branches et des feaiiles et servant k representer des connaissances sur un objet donne. Le SAGA 
comporte deux etapes* La premiere est celle de Tecriture* L*utilisateur construit sa structure de 
representation k partir d*un systeme assiste qui lui propose des choix dans des menus et qui construit 
pour lui les automates et les modeles consdtutifs de ce SAGA. Construire un SAGA ne consiste qu'i 
enoncer dans Tordre hierarchique les ncms des membres et la nature (conjonctive ou disjonctive) de 
isur dcmaine, les liens pouvaru felier les mentbres, ainsi que le type de feuiiie pouvant pousser a la 
fin des branches, c*est-i-dire k fournir le type d*information qui servira k Tinstanciation. L'utili- 
sateur d*un SAGA n*execute que deux types d*operations : il aiguillonne Talgorithme k chaque dis- 
jonction de membres et il remplit les feuilles des branches. 
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Le SAGA construit, la deuxieme etape consiste k I'appliquer k des cas concrets. Le systeme 
assiste alors Tutilisat^ur dans I'instanciation k I'aide de menus. II y a done deux types d'arbres 
produits par SAGA : I'arbre general de decision, construit lors de la conception du systeme et I'arbre 
instancie, refletant les choix effectues lors de Tapplication du SAGA k des objets reels. 

Les SAGA s'appuient sur une strategie inverse de celle des analyseurs dont le principe meme est 
rautoin'*iicit6 des procedures. Ici, les seuls automatismes sont contenus dans I'aide k I'ecriture et a 
rinstanciation des SAGA. Autrement, toutes les decisions sont prises par I'usager au moment de 
Texecution d'un SAGA. 

Les SAGA permettent de decrire des objets complexes k partir de nombreuses dimensions. Ces 
objets peuvent aussi bien 6tre des comportemems observes dans une garderie, des comportement 
delinquants consignes dans des dossiers de la cour ou encore, des contenus d'entrevues semi-dirigees. 
Ce systeme permet de decrire ces objets et de definir les relations entre ses diverses dimensions. 
Toute la panoplie des automates ou des modeles d'exploration D^redec peut 6tre appliquee a ces 
structures (EXFAD) ecrites en D6redec. De plus, des strategies d'inference peuvent etre associees a 
I'analyse des resultats obtenus des modeles d'exploration appliquee k ces bases de connaissances. 

Les figures 3 et 4 presentent respectivement I'exemple d'un arbre de decision et d'un arbre 
instancie. L'exemple est tire d'un SAGA ecrit pour enregistrer I'information a propos d'une inscrip- 
tion quelconque dans un dossier judiciaire^. En general, chaque domaine structurant d'un SAGA peut 
6ti* soit une conjonction (+) de membres, soit une disjonction (/) de membres. Dans l'exemple donne, 
une inscription est composee d'une conjonction de membres obligatoires (c'est-a-dire dont la presence 
est obligee) ou facultatifs (c'est-i-dire dont la presence n'est pas obligatoire). Dans la figure 3, les 
membres facultatifs se voient accoles d'un point d'interrogation (?). Certains membres peuvent etre 
relies k d'autres SAGA. Ainsi, le membre «acteur principal)) est relie aux SAGA «fiche-acteur)> et 
«fiche-tranche de vie)). Cela implique la capacite du systeme d'etablir des relations entre des bases 
de connar^ances differentes. Les membres peuvent dtre soit une branche (comportant elle-meme 
d'autres membres, comme le membre «interventIon))), soit une feuille, corame «acteur principal», 
«juge», etc. (Chaque branche comporte une ou plusieurs feuilles a son extremite). 

Une feuiile sera une expression atomique (valeur nominale), une qu6te au clavier, une qu6te au 
clavier avec apprentissage (confection d'une liste de valeurs), une qu6te dans une base de donnees, 
une quSte dans un document (texte) ou encore un reseau de feuilles. 

La figure 4 nous montre un exeinpie d'instanciation du SAGA «Inscription)) k propos d*un cas. II 
s'agit d'une denonciation par I'infirmiere de I'^cole, Garde Nantel, d'une eune fille. Mademoiselle 
Turcotte, le 21 avril 1964. Le juge Lalonde sera assigne au dossier et la consequence de cette de- 
nonciation sera une comparution k venir k la cour de Montreal. 



D^redec-EXPERT 

Nous avons deji defini le D6redec-EXPERT. II faut retenir ici que ce generateur de systemes- 
experts peut Stre utilise k partir des representations cognitives produites par SAGA. Cela permet 
d'appliquer la logique de I'inference dans le traitement de I'information qui est contenue dans les 
SAGA. II est d'ores et deji prevu que le moteur d'inference de D^iedec-EXPEIIT sera utilise dans le 

r'n/Aya circtAmAC A*f%T>'%\\tCA fAvtllAllA 



^Cet exemple «it tiU de la recherche : i<D6linquance juvenile et p5ychi&trie, 1910«1945», dirigde par Dtnielle 
Laberge et Jules Duchaatel, financde par le CRSH. 
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HGURE 3 
Arbre de decision : fiche-inscriptioa 




IiB CENTKE D'ANALYSE DE TBXTES PAR ORDINATEUR (ATO) 
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HGURE 4 
Arbre tnstanci^ : ftche-^inscription 



Inscription 



princtpol 



I f1ch98*tdv 



temps . 



•1964-10-2r 



i fiche s* tdv 



1 lieu U 



•Montrter 



f1ches*Heu 



contenu 



Intervention 




lieu 



•Montrtol" 



fIches-Uau 



acteur 

0880016 




acteur -i 



"NanteP ^ ^ 



1 



flches-acteur 



f kliee* tdv \i 



rt\e I |appartenonce| 
Inf1rm16re" "6coJe" 



3.3 Modules d'analyse de textes 
SACAO 

Le «Syst6me d'Analyse de Contenu Assistet par Ordinateur» (SACAO) vise a rSpondre au pro- 
bleme de I'aide informatisee 4 la lecture de donnees textuelles. Devant le volume considerable de 
textes qu'un nombre croissant de personnes sont appelees 4 d6crypter dans le cadre de leur activite 
professionnelle et en raison du caractere peu svstematique des methodes existantes, nous voulons 
g6neraliser les applications decoulant de certains modules de description, d'exploration et d'analyse 
t6xtuell6s dsveioppes au Centre, 

Les procedures de lecture de SACAO sont destinees a des applications particuli6res. Tout en 
conservantleur valeur d'application generale, elles permettent ains: un transfert mSthodoIogique entre 
differents contextes. En somme, il s'agit d'un systeme integre de lecture de textes comportant une 
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vanet6 de modalites descriptives t\ exploratoires. La compatibilite de I'ensemble des modu- 
les ecrits en D6redec et I'iaterface avec SATO permettent I'integration des modules de description 
(morphologique, syntaxique, semantique, cognitive, textuelle), d'exploration des donnees decrites et 
d'analyse des resultats. Le but recherche est de permettre t I'utilisateur du systeme de parametrer 
les procedures en fonction de son approche, soit en lui laissant le choix des modules pertinents pour 
son objet, soit en lui permettant de definir certains parametres particuliers de nature lexicale, mor- 
phologique, semantique ou cognitive pour Tun ou I'autre modele, soit en luI fournissant des options 
differentes pour I'analyse des donnees. 

Outre la mise au point des procedures d'integration et de modularisation du pysteme, une atten- 
tion particuliere est portee t trois axes de developpement de systemes d'analyse de contenu. Nous 
voulons ainsi incorporer des modules de descriptions textuelles allant au-dela de la syntaxe ou de !a 
morphologie. II existe presentement des prototypes d'analyse de I'argumentation d'un texte ou encore, 
de segmentation discursive. Nous construisons egalement de nouvelles procedures de dictionnaiies 
semantiques structures mettant en oeuvre les possibilites de programmation offerxes par SAGA. Nous 
elaborons enfin des procedures pour le reperage et I'analyse de la reference dans le discours (etude 
de la citation, du discours rapporte, du discours indirect libre). 



CORRECTEUR ORTHOGRAPHIQUE D^IVELOPPE AU QUEBEC^ 

Richard Kromp 
IBM Canada 



Dans cette communication, nous d^crirons Inexperience d*IBM Canada dans le ddveloppement 
d*un correcteur orthographique du frangais. il s*agit de SCOT, acronyme pour Systdme de correction 
orthographique et textuelle. Aprds la description de Thistorique du projet, nous donnerons un apergu 
de la contribution des services linguistiques. 



£tude du projet 

Le point de d6part du projet est un systferoe americain d*aide k la redaction appele PROOF. Ce 
syst^me identlfie les fautes d*6pellation dans un texte anglais de nature g6n6rale, propose des mots 
bien orthographi6s en tenant compte des variantes orthographiques entre Tusage am6ricain et '*nsage 
anglais, repfere cartaines expressions maladroites ou superflues et isole les mots qui d6passent un 
niveau de langue donn6, en fonction des nive5iux de scolarit6. Par exemple, il fait la distinction 
entre teacher^ d*un usage commun, et tuior^ beauqcup plus relev6. Le systfeme etait destin6 ^ dtre 
int6gr6 aux progiciels de traitement de textes pour venir en aide aux employSs appeles, dans le cadre 
de leur fonction, k faire de la correspondance commerciale. 



Des pourparlers entre le Centre de recherche de Gaithersburg qui avait d6veloppe PROOF et les 
services linguistiques d*IBM Canada ont commence en avril 1982. Le responsable du projet (le Dr 
Rosenbaum, directeur du groupe Technologie bureautique de pointe) 6tait alors a la recherche d*une 
6quipe de linguistes capables de mettre au point Ic pendant fran?ais du produit. 

Apres les discussions d*usage, nos services linguistiques obtenaient le mand-at de d6velopper le 
systeme. 



L'gquipe 

L*equipe de recherche 6tait constitute de six sp6cialistes canadiens. II s*agissait d*une 6quipe 
multidisciplinaire form6e de quatre employes d*IBM (Johar^ne Boucher, traductrice, Vivianne Cohen, 
directrice de la traduction, Marylene Le Deuff , documentaliste et Gaston Robitaille, informaticien). 
Une 6tudiante en ilnguistique de Tuniversitfi de Montr6al, France Boucher, a alors 6te engagee sur 
une base contractuelle, et le Dr William Mackey, lexicographe de Tuniversltfi Laval, servait de con- 
sultant a rSquipe. 



^Communication pr^nt<« low de la Deuxiftme ConWwnce de« chefo d'fitat et de Gouvemement de pays ayant en 
commun I'utage du frangaig, toui le thime : Industries de la l^sue, Quebec, 5 septembre 1987. 
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£tapes 

Le developpement s'est fait en trois etapes : 

1- recherche documentaire (pour faire le point sur I'etat de la question); 

2- etabUssement du vocabulaire; 

3- tests. 



Phase I - recherche documentaire 

L'objectif de la recherche documentaire etait d'identif ier les publications existantes en f rangais, 
sur lesquelles le travail de I'equipe pouvait reposer. A la lumiere de ces resultats, il fallait ensuite 
identifier les fonctions du programme americain qui pouvaient (ou devaient) Stre mises au point en 
frangais. 

La documentaliste a etabli une biblio'graphie detaillee des articles, etudes, rapports, theses, 
dictionnaires (techniques et gen6raux), grammaires, guides de correspondance diSDonibles jusau'alors. 
De i'examen de tcute cette documentation I'equipe a pu tirer quatre conclusion: 

U Personne n'avait jusqu'alors produit d'Stude de la langue frangaise par rapport aux niveaux 

de scolarite, comparable ^ ce qui existe pour I'anglais. 
2 . On n'a pas trouv6 d'etudes de frequence du vocabulaire f rangais portant essentiellement sur 

la correspondancf commerciale moderne (d'oii la necessite de constituer un corpus original). 

3- Contrairement k I'anglais britannique et I'anglo-americain, il y a peu de differences entre 
I'usage orthographique en fran?ais hexagonal et en frangais quebecois. Les differences 
lexicographiques se situent principalement sur le plan semantique. Si aux yeux du quebe- 
cois, le mot cabaret evoque un plateau, il signifie pour le frangais nightclub ou dancing. 
Mais d'une rive i I'autre de 1' Atlantique, on s'entend sur sa graphie. Les exceptions sont 
relativement banales; il y a bien queiques accents sur des majuscules qui l ottent un peu 
plus dans les interlignes hexagonaux, mais les differences s'arr^tent li. 

4- Finalement, la documentation permettant de realiser pour le frangais les fonctions du 
programme americain existe bel et bien, mise k part I'identification du vocabulaire par 
niveau de scolarite. Qui plus est, le nombre de dictionnaires et de lexiques specialises 
est impressionnant. Le projet visera done d'abord t developper les fonctions de correction 
orthographique, les fonctions textuelles devant faire I'objet de rechcrchcs subscquemes. 



Phase 2 Constitution du vocabulaire 

II fallait, au point de depart, constituer un corpus original, compte tenu du contexte commercial 
dans lequel le correcteur allait dtre utilise. II fallait depouiller la correspondance d'affaires. Pour ce 
fairiB, IBM beneficiait de milliers de documents stockes sur medias electroniques (disquettes, cartes et 
bandes magnetiques). Ces documents avaient deji ete recueillis che.t les clients d'IBM France en 
1977. Les donnees apparaissantsous des formats multiples, II fallait r/abord les convertir en format 
standard. De ces textes, un corpus de 150 000 entrees frangaisee a ete compile et les entrees clas- 
sees par ordre de frequence. Par souci d'^conomie et de performance, les entrees devaient 6tre 
inscrites sous forme de racines et de desinences. L'equipe a alors dfi developper une structure de 
derivation particuliere au francais pour tenir compte des specificites de !a iangue fran^alse (decHnai- 
sons verbalcs, formes adjectivales, etc.). II a egalement fallu modifier les programmes americalns pour 
qu'ils reconnaissent les caracteres frangais accentues. 
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Une revision initiale sMmposait cependant, dans le but d*eliminer les mots mal orthographies, 
certains hapax sans interfit et des initiatives malheureuses de Tequipe americaine qui nous cuggdrait 
des formes complementaires de type hommes ence.ints et tu pleuvais. II fallait aussi ajouter k la lisle 
lexicale certains mots du fran9ais fondamental malheureusement absents de Techantillonnage (certains 
titres par exemple), des formes verbales et adjectivales complementaires, des element- .>es d'un 
corpus parall^le etabli k Paris dans le cadre d*un projet de recherche de transcription stenographique. 



Ajout des noms propres 

L'equipe de recherche etait alors relativement satisfaite de la liste etablie, mais un probleme 
subsistait toujours : la liste des noms propres etait lacunaire. 

Pour la completer, on a ajoute les noms de lieux geographiques les plus usuels en France, au 
Canada et aux Etats-Unis, bs noms des 500 plus grandes societes fran^aises et canadiennes, les 
prenoms les plus courants, les noms de famille occupant plus de deux pages dans Tannuaire telepho* 
nique de Montreal et de Paris (comme Boucher, mais pas Kromp) ainsi que les noms de villes et de 
nay*: imnnrtants. 

Une fois tout ce tra/ail effectue, ies fichiers ont ete con<^^"*'ies, et la liste regroupe 20 000 
mots-racines pouvant s'etendre k 205 000 mots individuels. 



Phase 3 Test 

Le produit a ensuite etc teste, comme c*est le cas de tout produit en developpemert. On a 
«scott6» (si vous me permettez ce n6ologisme maintenant usuel k nos services linguistiques) 55 000 
mots tirfis de lettres-types trouv6es dans huit guides de corresnondance fran9aise, de la correspon- 
dance du service de communications de Montreal et des propositions redigees par le personnel des 
succursales d'IBM ^ Montreal. Ces textes ont tous ete 4>aisis sans revision par une secretaire. Le 
taux d'efficacite a ete etabli i 99,85%. Le produit pouvait done 6tre remis, des aoOt 1983, au 
Centre de recherche de Gaithersburg et int6gr6 aux logiciels de bureautique IBM (par exemple, Visio 4 
et les services personnels PC). 

Cft fftsnltat ft*5t 1ft frnit d'nn savnir-faire qnehftcni.*:. T! faut toutefois 6tre honnSte. et rendre ti 
Cesar ce qui lui revient : les programmes initiaux ont ete con^us par des chercheurs americains. 
Mais le savoir-faire quebecois conjugue k Teffort de la France en a permis Tadaptation. 
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DfiCOUPAGE AUTOMATIQUE DE TESTES EN MOTS SIMPLES^ 

Jacques Ladouceur 
Langues et linguisdique 
Universiti Laval 



L Introduction 

En iinguistique* Tanalyse automatique implique souvent au moins deux Elements : un 
texte a analyser, dent la saisie a et6 faite i Taide d'un logiciel de traitement de texte, 
et un logiciel d'analyse. 

Sauf exception un texte, sous sa forme textuelle (suite de phrases), n'est pas compatible avec un 
logiciel d^analyse. Pour fitre en mesure d*£tre traiti par un logiciel d'analyse, un texte doit subir une 
transformation qui consiste en un d6coupage en mots simples. Voici im texte avant (voir figure I) et 
aprfes un d6coupage (voir figure 2) : 



nGURE 1 



Sam paritr" dm \% xnor, d«s femmat ou du toleil, chaqu« caillou ft ton histoira. Chaquo 
tftillU M forit viers«, ch&qui nuni tft mursUli di Chlni, ms fftlftu«s d*£tr«tftt, «t 1« 
molndr* coin d« run m« Jwd'ns eiup«ndtit. 



FIGURE 2 







OOOOCI 


000001 


p«rler 




000001 


000002 


de 




000001 


000003 


la 




000001 


000004 


aer 




000001 


000005 


del 




oooori 


000U06 


feioaei 




000001 


000007 


ou 




000001 


000008 


du 




000001 


000009 


■oleil 




000001 


000010 



^Communicktlon prte«nt<o Ion du 56* Congri* de I'ACFAS, Moneton, 9-13 m&i 1988. 
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2. La probl^matiquc du d6coupage automatique 
2.1 Caractiristiques particuiieres des text . 

Lorsqu'on observe attentivement un grand nombre de textes, du point de vue de la i«iSe en 
'^dge, on^e rend corapte qu'ils ont chacun des caractiristiques particulieres. Rarcment oeux textes 
sont complitement identiques. Voici quelques examples : 



Ex. 1 

[PARAGRAPHE 1) 

SANS PARLER DE LA MER, DES FEMMES OU DU SOLEIL, CBAQUE CAILLOU A SON 
mSTOIRE. CHAQUE TAILLIS SA FOR£T VIERGE, CHAQTO RUINE SA ?yiURAILLE DE 
CHINE, SES FALAISES D'fn^RETAT, ET LE MOINDRE COIN DE RUE SF-S JARDINS S^'S- 
PENDUS. 



Ex2 

IP.11 

<LOUIS LAINE> DIS-MOI QUE TU M'AIMES ENCORE. LA NUIT EST VENUE! 
MAINTENANT JE SUIS LACHEI MAINTENANT JE PUIS PRONONCER DE TELLES 
PAROLESI <MARTRE> IL EST TROP TARD. TU N'ENTENORAS POINT LE MOT QUE TU 
DEMANDES DE MA BOUCHE. SOHGE A TOI SEUL! <LOUIS LAINE> EH BIEN DONC, 
KULHEURAMOII 



Foc3 

IP.11 

LOUIS LAINE DIS-MOI QUE TU M'AIMES ENCORE. LA NUIT 

LOUIS LaINE ESTVENUEI MAINTENANT JE SUIS LACHEI 

LOUIS LAINE MAINTENANT JE PUIS PRONONCER DE TELLES 

LOUIS LAINE PAROLES! 

MARTHE EST TROP TARD. TU N*Em >iDRAS 

MARTHE POINT LE MOT QUE TU DEMAjNDES DE MA 

MARTHE BOUCHE. SONGE A TOI SLUL! 

LOUIS LAINE EL BIEN DONC, MALHEUR A MOI! 



Dans le premier example, on constate la presence d'un numero de page en haut S droite. Le 
num6ro de page est encadr6 par les signes { et }. On constate aussi la presence d'un numero de 
paragraphe qui est encadrd par les signes I et K 

Dans le deuxifeme exemple, un extrait de piSce de theatre, il n'y a pas de numero de paragraphe. 
Cependant, on peut voir un 616ment supplementaire : le nom de la personne qui parle. Cette informa- 
tion est plac6e entre les signes < et >. De plus, le numero de page se situe en haut aa centre et est 
place entre les signes ( et I. 



Dans le dernier exemple, le texte est le mSme que dans Texemple precedent. Toutefois, il y a 
des differences. Le nom de la personne qui parle n'est encadre par aucun signe. II est place a des 
endroits fixes de chaque ligne de texte & I'interieur d'une zone de quatorze caracteres. 



DfiCOUPAGB AUTOMATIQUB DB TBXTE3 EN MOTS SIMPLES 



125 



2.2 Exigences particulieres d'un logiciel d'analyse 

D'line fagon generale, tous les logiciels d'analyse ont chacun des exigences particulieres. Ces 
exigences portent principalement sur deux plans. D'une part, un texte decoupe doit Stre place dans 
un fichier qui a une structure adaptee au logiciel d'analyse. D'autre part, le fichier doit contenir 
tous les 616ments d'information que le logiciel d'analyse exige (ex. numero de ligne, ordre du mot 
dans la ligne, numero de paragraphe, etc.) et ces elements doivent dtre places dans un ordre precis. 
Voici quclques exemples de structures^ de fichiers que des logiciels d'analyse pourraient exiger : 



Ex. 1 



pendant 




OOOOQl 


000001 



Ex. 2 





p. 1 


000001 


00001 





Ex. 3 



DIS 


LODIS LAINE 


P.l 


00001 


1 


F 


F 


0 





EX. 4 



PENDANT 


P.l 


01 


1 


F 


000 



Dans le premier exemple, on voit que la fiche est composee de quatre zones. La premiere zone 
contient le mot, la seconde, un signe de ponctuation, la troisieme, le numero de la ligne d'ou provient 
le mot et, finalement, la demiere contient i'ordre du mot dans la ligne d'ou il provient. Remarquons 
aussi que ie mot est en caracteres minuscules. 



Dans le deuxieme exemple, la fiche est constitute de cinq zones. La premiere zone, qui est plus 
courte que dans 1' exemple precedent, contient le mot, qui cette fois apparait en caracteres majuscules. 
La seconde zone contient un numero de page. Les troisieme et quatrieme zones contiennent respecti- 
vement un numero de ligne et i'ordre du mot dans la ligne ou ii est. 



Etens le troisieme exemple, la fiche est constitute de neuf zones. La premiere contient le mot, 
qui cette fois n'a et6 converti ni en caractferes minuscules ni en caracteres majuscules. La seconde 
zone contient le nom de la personne qui parle (dans le cas d'une piece de theatre, par exemple). La 
troisieme zone contient un numero de page. Les zones quatre et cinq contiennent un numero de ligne 
et i'ordre du mot dans la ligne dont ii provient. Remarquons aussi que la longueur de ces deux 



^L<t exemples que noui pr^entons tont fictift. Bn general, let structures qu'exigent les logicieU d'analyse sont 
beaucoup plus complexes. Ces structures ont M cr^to aHn de simpllfler la presentation. 
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derniefes zones n'est pas la mSme que dans les exemples precedents. Les trois zones suivantes con- 
tiennent des elements d'infonnations qui ne sont pas lies a un texte mais qui peuvent gtre exiges par 
un logiciel d'analyse. Finalement, la neuvieme zone contient un signe de ponctuation. 

Le dernier exemple montre les fiches qui sont constitutes de quatre zones. On peut voir que la 
zone reservee pour le mot est beaucoup plus longue que dans les exemples precedents et qu'il n'y a 
pas de zone reservee pour un signe de ponctuation. 



23 Contraintes 

Etant donne qu'un texte possede des caracterisliques particulieres et qu'un logiciel d'analyse a 
des exigences precises, nous sommes conf rontes a la situation suivante : un programme de decoupage 
peut lire un texte de type X, et seulement de type X, et le transformer en X\ et seulement en X\ 

Lors de la mise au point d'un programme de decoupage de textes, la forme des textes a saisir et 
la forme des textes apres decoupage doivent fitre etablies. Cela entraine un certain nombre de con- 
traintes. 



D*abord, les ter :s non conformes au programme de decoupage qu'on de^^ire utiliser doivent etre 
remanies. Ensuite, si pour une raison quelconque on decide de modifiei la forme de nouveaux 
textes a saisir, on doit alors modifier ou refaire le programme de decoupage. Bref , s'il n'y a pas de 
compatibilite entre un texte et un programme de decoupage, on doit, soit modifier le texte, soit 
modifier le programme de decoupage. 



2A Solution proposes 

La solution qui pourrait dtre apportee au probleme de decoupage est la suivante : un logiciel de 
decoupage automatique de textes en mots simples pourrait lire un texte dont la saisie a ete faite 
selon n'importe quelle convention et le transformer sous n'importe quelle forme. 



3. D.A.T., an logiciel de decoupage automatique de textes 

Lorsqu'on procede au deco^^^age automatique d'un texte, on doit '^nir compte d'une certaine 
quantite d'informations qui varient d*un texte a Tautre. De plus, on doit prevoir la possibilite de 
generer un resultat qui peut prendre une infinite de formes. Pour cela nous avons cree un systeme 
de decoupage qui fonctionne en utilisant les directives qui proviennent de Tutilisateur. 

Les directives de decoupage peuvent etre ' ^tenues a Faide d'un module d'interrogaaon qui fait 
pa;tie du systfeme de decoupage. Le modub inu *oge Tusager afin d'obtenir une description du texte 
t decouper et de la forme sous laquelle le texte sera transforme. L'information transmise par Tuti- 
lisateur est acheminee dans un fichiei de directives. Au moment du decoupage, le systeme de decou- 
page active un module de generation. Ce dernier procede a une lecture du fichier de directives et 
genfere une serie de regies de deCv page, une fiche tampon, qui correspond a la forme desiree pour le 
resultat, et finalement un index permettant d'acheminer correctement Tinformation tiree du texte 4 
rinterieur de la fiche tampon. A Tinterieur du systeme de decoupage, il y a finalement un module de 
decoupage qui fonctionne en utilisant les regies de decoupage et qui transmet ses resultats via la 
fiche tampon et Pindex a Tinterieur du fichier de sortie. 
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Voici le schema du systdme de d6coupage : 



Voici le achtoft du syst6»e de d^oupjige 



Fichier de directives 



Module d*in<- 
terrogation 




Systine de d^oupage 



Module de g^- 
n^raticn den 
regies, de la 
fiche tampon 
et de l*indcs 



Piche taspon 



Index 



Ragles de ddcoupage 



Module de d^coupage 



3 J Le lancement du module d'interrogation 

Pour activer le module d'interrogation, il suffit de foumir ^ Tordinateur, ^ partir du D.O.S., 
rinstruction suivante : DAT <pom du fichier struc{ure>/s. DAT est le nom du logiciel de d6cou- 
page. Le signe /s indique au logiciel qu*on desire activer le module d*interrogation afin de creer ou 
modifier le fichier structure dont le nom est pr6cis6 juste avant le trait oblique. Par exemple, si on 
veut creer ou modifier le fichier structure lemme.str on donne Tinstruction DAT lemme.str/s. 

Lorsque le module d*interrogation a 6t6 activ6, un premier menu apparait i TScran 
(voir figure 3). 
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FIGURE 3 



A T 



STRDCTDRE , 

I 

1. CR£CR ONE NOUVEIXE STRDCTDRE 
2» A'^ficher la structure 
3* Retourner au DOS 



Le menu offre trois options. La premidre pennet de cr6er un fichier structure lorsqu'il s'agit 
d*un fichier qui n'existe pas. Si le fichier est deji cre6, le module d'interrogation choisit automa- 
tiquement 7- MODIFIER UNE STRUCTURE. On peut choisir Tune ou Tautre des trois options k 
I'aide des touches fl&ches hAut et filches has du clavier. L'option s61ectionnee apparait en caisctferes 
majuscules. Par exemple, si on appuie sur la touche fliche has Toption 1 se reecrit en caractferes 
minuscules et Toption 2 se r6Scrit en caractferes majuscules. 



3 J La creation d'me structure 



Si on choisit la premiere option, cr^er une nouvelle structure, alors Tecran affiche un tableau 
qui s'intitule CREATION DVNE STRUCTURE (voir figure 4). 

n y a deux fenfttres h TintSrieur du tableau. La premiere s*intitule Message (s) et la seconde 
Longueur. Dans la fenfttre Message (s) deux indications sont inscrites. La premiere, Zone 1/F, 
montre k Tutilisatexir qu'il d6crit la premiere zone et que cette zone est la dernidre de la fiche. II 
est tout k fait normal que la premifere zone soit la demiftre puisque Tfitape de creation commence. Si 
Tutilisateur 6tait en train de modifier une structure composee de huit zones il verrait affiche le 
naessage Zone 1/8. Le second message indique k Tutilisateur qu*il peut mettre fin k Titape de crea- 
tion d*une structure en appuyant sur la touche d*6chappement Esc. 



CRfiATION D'DNE STRDCTDRE 



MESSAGE (S> 

Zone 1/tr* 
<E«c> psur terminer 



LONGDEUR — 



ERLC 



1 



Zb 
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La seconde fenfttre, longueur, indique 4 Tutilisateur qu*il doit preciser la longueur de la zone 
in(iiqu6e dans la fendtre des messages. Dans Texemple, il s*agit de la zone 1. La presence des d«ux 
fiiches sert i indiquer qu'on pent faire augmenter ou diminuer le chiff re, plac6 t droite des fleches, 
en utilisant les touches fliche bas et fl&che haul du clavier. Le chiffre correspond d, la lon- 
gueur de la zone. Lorsqu'il ddtermine la longueur de la zone, Tutilisateur appule jur la touche retour 
et le module d*interrogation modifie le tableau. La fenitre longueur se d^place sous la fendtre des 
messages. Ensuite, une nouvelle fendtre qui s'intitule conienu appara2t (voir figure 5). 



nCURE 5 



CREATION D'TNE STRDCTOHE 



MESSAGE (S) 
Zone 1/F 



LONGOEOR 

/V , \/: 20 



C 0 N T E N 0 



1- MOT 

2- Ponctxiation 

3- Nuto^ro de ligne 

4- ordre du »or. dans la ligne 

5- Rtff^rence 

6- vide 

7- Constante 



En faisant apparaitre la fenStre contenu> le module d'interrogation indique t Tutilisateur qu'il 
doit prdciser le contenu de la zone dont le numero apparait dans la fenfitre des messages. Sept types 
de contenus sont possibles : un mot, un signe de ponctuation, un numero de ligne, Tordre du mot 
dans la ligne, une refdrence, un vide ou une constante. L'utilisateur pent choisir un des types en 
utilisant les touches fliche bas et flfeche haut du clavier. Le choix apparait toujours en carac- 
tdres majuscules. Lorsque le contenu a et6 precise, on appuie sur la touche retour. Nous choisirons, 
$n guise de contenu, Toption mot. Une nouvelle fenitre apparait, separateurs, sous la fendtre con- 
tpnvi (voir figure 6). 
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HGURE 6 



CREATION D'ONE STROCTORE 



MESSAGE (S) 
Zone l/P 



LOKGOEUR 

f\ , V/: 20 



C 0 N T E H 0 



1- MOT 

2- Ponctuation 

3- Num^ro de ligne 

4- Ordre du Dot dans la ligne 

5- R^ftfrence 

6- Vide 

7- Constante 



2 1» pj^t?lTSUHS 



^ En faisant apparaitre la fendtre s6parateurs le module passe au second plan d'interrogation et 
indique ^ Tusager qu'il a besoin d'un supplement d'information. En d'autres mots, il demande ^ 
Tutilisateur comment le module de dicoupage devra faire pour reconnaitre les mots dans le texte quMl 
dficoupera. Sachant i Tavance que le dficoupage des mots simples se fait en consultant une liste de 
s6parateurs, il pr6sente done une liste genSrale de s6parateurs que Tutilisateur peut modifier. L'uti- 
lisateur peut, par exemple, sdlectionner un s6parateur i Taide des touches flfeche droite et 
fliche gauche ou le faire disparaitre avec la touche fliche ^as ou encore, le faire reapparaitre avec 
la touche fliche haut. 



Lorsque Tutilisateur a s61ectionne les separateurs qu'il veut utiliser, il appuie sur la touche 
retour La fenStre siparateurs est deplac6e vers la gauche pour faire place i une nouvelle fendtre 
qui s'intitule conversion des mots (voir figure 1\ 



La fendtre conversion des mots permet 4 Tutilisateur d*indiquer s*il d6sire que les mots soient 
convertis en caractdres minuscules, majuscules ou quMls demeurent tels quMls apparaissent dans le 
texte^ Lorsqu*il a fait son choix, I'utilisateur doit appuyer sur la touche retour Le module revient 
alors au premier plan d'interrogation et passe i la zone suivante (voir figure $)• 



La fenStre des messages indique qu*il faut dficrire la zone 2, Si Tutilisateur desire une seule 
zone dans la fiche, il faut appuyer sur la touche Esc et le module dMnterrogation met fin i la seance. 
Pour la demonstration, nous allons continuer et la longueur de la seconde zone sera d*un seul carac- 
t6re (voir figure 9). 
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nCURE 7 



CRCATION D'ONE STRUCTURE 



MESSAGE (S) 
Zone 1/F 



tONGUEUR 

/\ , \/J 20 



SePARATEDRS 



C 0 N T E n U 



Bff ),-,/:;?"ir_n<> 



1- MOT 

2* Ponctiiation 

3* Nuis^to de ligne 

4* Ordre du mot dans la ligne 

5* Rtff^rence 

6- Vide 

7- Constante 



- CONVSStSION DES MOTS 
1- MINUSCULES 
2* Majuscules 
3* Aucun changeinent 



Maintenant, nous allons indiquer au module d^iaterrogation que le co!iteiiu de la zone est un 
signe de ponctuation. Pour cela nous choisissons la deuxi&me option dans la fondtre contenu. Comme 
ie module n'a pas besom d'autre information, il ne passe pas au second plan d'interrogation. li 
pr£sente k nouveau la fen6tre longueur et indique, dans la fen6tre des messages, que la troisieme 
zone devra fttre ddcrite (voir figure 10). 



nCURE 8 



CREATION D*CNE STRUCTURE 



MESSAGE <S) 

Zone 2/F 
<Esc> pour terminer 



tOHGUEUR — 



Lorsque le contenu d*une zone est un signe de ponctuation, un numero de ligne, un numero de 
mot ou un vide le module riagit toujours de la mfime fayon. II passe immediatement k la zone sui- 
vante. Cela s'explique par le fait que le systSme de decoupage n'a pas besoin dMndlcation afin de 
trouver ces el6ments dans le texte a d^couper. 

Lorsque Tutilisateur indique que le contenu d*une zone est une reference, une nouvelle fendtre 
apparaJt ^ Tecran (voir figure 1 1). 

O i or. 
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nCURE 9 



- CREATION D'DNE STRDCTORE 



HESSAGE (S) 
Zonm 2/? 



LONGUEUR 

/\ , \/x 1 



C 0 N T B N U 



1- MOT 

Ponctuation 

3- Niu&^ro de ligne 

4- - Ordre du mot dans la ligne 

5- R^f^rence 

6- Vide 

7- - Conatante 



^ Lorsque le contenu d*une zone est une reference, le module s^informe k savoir s*il s*agit d*une 
reference i position variable ou d*une reference k position fixe. Pour r6pondre, il s*agit de selec- 
tionner une option k Taide des touches fliche haut et flichc bas, Le choix apparait en caractferes 
majuscules. 



FIGURE 10 

CRCATIOM O'UNE STRUCTURE 



MESSAGE (S) 

Zone 3/P 
<Eac> pour terminer 



LONGUEUR — 



ERLC 



3u 
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FIGURE 11 

CRftATIOS D'UME STRUCTORB 



MESSAGE (S) 
Zone 3/P 



LONGUEUR 

/\ , \/: 06 



C 0 N T E N C 



1- Mot 

2- Ponctiution 

3- Nua^ro de ligne 

4- Qrdrtt du sot dans la ligne 

5- RgpeRENCE 

6- Vide 

7- Constante 



R£PeREKCS 



POSITION PIXE 
Position variable 



Si la r6f£rence est k position fixe, le module fait apparaltre une nouvelle fen^tre qui s^intitule 
dibut de la rif6rence (voir figure 12). 

A cette 6tape, Tusager indique, en utilisant les touches fliche haut et fl^che bas 
la position i laquelle commence cette reference A chaque ligne de texte. En guise d'exemri^, choi- 
sissons la position I. Lorsqu'on appuie sur la touche retour le module dfiplace la fenitre vers la 
gauche, en la superposant i la fenfttre r6f6rence, et fait apparaltre une nouvelle fenfttre qui s' intitule 
longueur de la riif^rence (voir fisure 13). 

Ce faisant, le module indique & Tutilisateur qu*il desire connaitre la longueur des references qui 
commencent ^ la position 1 ^ chaque ligne de texte. Nous choisirons une longueur de 6. 

HGURE 12 

CREATION D'DKE STRUCTURE 



MESSAGE (S) 
Zone 3/P 



ZX}NGUEtm 



/\ , \/: 06 



C 0 N T E N U 



1- Mot 

2- Ponctuation 

3- Nua^ro de ligne 

4- Ordre du sot d^ns 1^ ligr 

5- RtPftRENCE 

6- Vide 

7- Conatante 



ERIC 



REP£RE»CS 



POSITION PIXE 
Position variable 
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Lorsqu'on indique au module qu*une riference est du type position variable alors, i la place de 
la fenetre dfibut dc la riffirence, il fera apparaitre une fenfitre qui s'intitule dfilimiteur gauche (voir 
figure 14). 

Deux 6Iements apparaissent dans la nouvelle fenStre : uue valeur ASCII et un caractfere. La 
valeur ASCII est le code decimal ASCII qui correspond au caractire place en dessous. 



nGUJRE 13 



CRCATION D'ONE STROCTU^E 



MESSAGE (S> 

Zone 3/F 



— LONGOEOR 



— DfiBDT DB LA RCFfiRENCE . 

A , V/ : 1 



C O K T E N 0 , 

1- Mot 

2- Ponctuation 

3- Nua^ro de ligne 

4- Ordre du not dans la ligne 

5- R£F£RENCE 

6- viae 

/-* Constante 

- LOKGOEOR DE LA Rfi?fiRENCE -i 
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Lorsqu*on appuie sur la touche flfcche haut, le code decimal augmente et le caractere corres-* 
pendant au code kpparait en dessous. Lorsqu'on appuie sur la touche fliche bas, le code clecimal 
diminue et le caracvire correapondant au code apparalt en dessous. On peut done choisir le caractire 
qui est utilis6 da^^ le texte en guise de d61imiteur gauche de la reference. Choisis5ons le 
caractire ( qui a la valeur ASCII 40. 



nCURE 14 



CRmXON D'UNE STROCTOTE 



MESSAGE (S) 



LONGOEire 



Di*v#nru/»ir 



Position fixe 
POS£TXON VARIABLE 



CONTEND 



A— not 

2- Ponctuation 

3- Nua^ro de ligne 

4- Ordrs du not d«na la ligne 

5- REFERENCE 

6- Vide 

7* Conatante 



V^leur ASCII: ';3 
Caractere: 1 



Lorsque le choix a et6 fait et qu*on appuie sur la touche retour, la fendtre est deplacee vers la 
gauche pour faire place t une nouvelle fen6tre qui s^appelle dilimiteur droite (voir figure 15). 

Avec la fenfttre dilimiteur droite nous procedons exactement de la mfime fa?on qu'avec la fenft- 
tre dilimiteur gauche. La seule difference est que nous choisissons le caractere utilise en guise de 
dilimiteur droite pour la reference dans le texte. Choisissons le caractfere ) qui a la valeur ASCII 41. 
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nCURE 15 



CRftATlOH D*ONE STROCTURE 



MESSAGE (S) 
Zon« 4/P 



LONGUEUR 



06 



DfiLXHXTEDR CADCHE 



Valeur ASCII: 40 
caract^ifex ( 



CONTEND 



1- Mot 

2* Ponctuation 

3- Hua^ro de ligne 

4- Ordre du not d«na la Ilgne 

5- REFCREKCE 

6- Vide 

7- Constante 



OSLIMITEDR OROITE 

V«l«ur ASCII: 33 
Caractfere: 1 



Lorsque le dilimiteur droite a et6 identifi6, le module retourne au premier plan d'interrogation 
et demande la dwcription de la zone suivante, Pcur Texemple, il s*agit de la cinquiSme zone. Pour 
cene zone, nous indiquerons que nous voulons y placer une constantef Le module fait apparaitre une 
nouvelle fenfitre qui s*intitule constante (voir figure 16). 



FIGURE 16 

— CRiATlON D'OHE STRDCTURE 



iicSSACE (S) 
Zone 5/F 



LO.*lGOEOR 

/V . \/i 10 



CONTEND 



1- Mot 

2* Ponctuation 

3- Niua^ro de ligne 

4- Ordre du »ot dans la ligne 

5- Rtfftfrence 

6- Vide 

7- CONSTANTE 



CONSTANTE 
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En faisant apparaitre cette fenStre, le module demande de faire la saisie de la constante ^ 
placer dans cette zone, n suffit d'en faire la saisie, de la mfime fagon qu'on le ferait avec un logi- 
ciel de traitement de texte. Pour Texemple, la constante sera : 0000000000^ 



Jusqu*4 maintenant cinq zones ont 6t6 ddfinies. La premiire contient un mot, la seconde un 
signe de poactuation, la troisiime une r£f6rence i position fixe, la quatriime une reference ^ position 
variable et la demiire une constante. Pour mettre fin k la stance de criation d'une structure on 
appuie sur la touche Esc du clavier. Le module nous ramene done au menu principal (voir figure 17). 



3 J L'affichage d*une structure 



Comme on pent le voir, la premiere option du menu n'est plus Creation d*une nomelle structure^ 
mais plut6t Modifier une structure. Puisque nous avons d6j4 cr6e une structure nous ne pouvons que 
la modifier ou la faire afficher (voir figure 18). 



HGURS 17 



DAT 



STROCTORB 



1. MODIFIER ONB STROCTORE 

2. Afficher la structure 

3. Retourner au DOS 



Pour Taffichage, il y a deux fenfttres. Dan" >/.cmi4re, celle du haut, figure Tinformation 
qui a 6t6 obtenue avec le premier plan d'iiiter ^ aun : le contenu et la taille des zones. Dans la 
seconde fenfttre apparait Tinformation qui « tii obtenue avec le second plan d*interrogation. Le 
contenu de la seconde fenfttre correspond i . zone dont le contenu est ecrit en caracteres majus- 
cules. Dans Texemple^ le contenu de la seconde fenitre correspond k la zone 1, qui contient le mot. 
II est possible de voir Tinformation compl6mentairc qui est rattachee aux autres zones en utilisant les 
touches Cliches haut et fl&ches has. Par exemple, en choisissant la quatrieme zone appa- 
raissent les informations suivantes : le delimiteur gauche ( et le delimiteur droite, qui est ) (voir 
figure 19). 
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nOURE 18 



DAT 

AFFICHAW 



Zone 


contenu 




1 


MOT 


20 


2 


Ponctu«tion 


1 


3 


Rtfff rencc 


6 


4 


R6£^rence 


6 


5 


conatantc 


10 



- INFORHATIONS COMPtCMENTAIRES - 
S^p.j Bl-*(),-./:;?-l}- no 
Converaion : ainuiculea 



I 



4. Le d6coupage 

La seance d'interrogation de Tutilisateur est sans ccnteste Titape la plus delicate du systeme 
de ddcoupage. La qualltd du rdsultat d6pend directement de cette op6ration. Le processus de d6- 
coupage s^active d^uts fa?on tris simple. Afin de procdder au dficoupage, il faut donner au systeme 
deux instructions. 



nGURE 19 



:^rFiciACE 



2one 


contenu 


tallle 


1 


Mot 


20 


2 


PonctUAtlon 


1 


3 


R^f^rence 


6 


4 


R£F£RENCE 


6 


5 


constante 


10 



- INFORMATIONS COMPttMBNTAIRES - 
D^linltcur gauchet ( 
D^lialteur drolte: ) 
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La premiere instruction sert a indiquer au systeme le nom du fichier de directives qu'on desire 
utiliser pcur le decoupage. Supposons que le nom du fichier de directives qu'on desire utiliser est 
lemme.str. II s*agit de donner Tinstruction suivante : DAT lemme.str/c. 

Lorsqu*on a indique le nom du fichier de directives on peut alors proceder au decoupage. Sup- 
posons que le nom du fichier ^ decouper soit texte.txt et que le resultat doive §tre place dans un 
fichier du nom de resultat.txt. II faut donner Tinstruction suivante : DAT texte.txt result^t.txt. 
Le module de decoupage se met alors en marche et le travail se fait ^ tres grande vitesse. 



5* DSveloppement h venir 

Certaines modifications seront apportees au systeme de decoupage afin qu*il puisse lire un die- 
tionnaire, dent la saisie a ete faite i Taide d'un logiciel de traitement de texte, et le decouper de 
fagon & permettre son automatisation. 

Avec un fichier de directives apptopriees, le systeme de decoupage sera en mesure de distinguer 
la micro-structure de la macro-structure et de distinguer egalement tous les elements constituant la 
micro-structurft. II constituera une fiche par entree du dictionnaire. Dans chaque fiche il y aura une 
zone pour le mot et une zone par element de la micro-structure. 

Un dictionn' 're ainsi decoupe pourra §tre transmis 4 un logiciel de gestion de banque de donnees 
qui pennettra un sxcces direct 4 chacun des elements de la macro-structure et de la micro-structure. 
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UN MODULE LINGUISTIQUE 
POUR L'INFORMATIQUE GOUVERNEMENTALE DES ANNEES 1990^ 

Richard Parent 
Ministere des Communications 
Gouvernement du Quebec 



Le r6le important que la langue frangaise est appelee i jouer dans les systemes informatiques de 
nos organisations constitue Tobjet de cette communication. Nous allons d'abord preciser la vision 
prospective d^un module d^infonnatique linguistique de fa;on theorique, puis nous donnerons 
Texemple de ce qui a et6 entrepris avec des moyens encore experimentaux au sein de I'administration 
publique quebecoise, 



1.0 Prospective 

Dans une perspective generale, la figure 1 illastre revolution des principaux usages de Tinfor- 
matique dans une grande organisation nord-am6ricaine typique : 



FIGURE 1 

Evolution de Tusage de IMnformatique dans une grande organisation. 



Annies Objet du traitement l^f^thodes et techniques 



1966 DONK£:£S - enunageuiinage, cI&M^ment, calcul 

19^ INFORMATION - r^&ux, interfaces, transactions, 

SGBD^ til^matique, g^nie logiciel 
1995 CONNAISS ANDES - systimes*experts et trait ement de 

ia langUQ natureiie, moteurs dMnf6- 
rences, analyseurs et dictionnaires. 



Les perspectives k long terme evoquees ci-apres s'inspirent des visions de chercheurs reputes 
(Sowa 1984; Johnson 1985 et Tenenbaum 1987). Johnson parle d'un «systeme de langage corporatif» 
qui sera base sur le vocabulaire defini par son domaine particuHer, ca' able d'accommoder diverses 
vues extemes selon les besoins dfts usagers, mais ayant une structure conceptuelle definie via des ou- 



Rir 



^Communication pr&ent<e lors de la Deuxifimt Conference des chefs d*fitat et de Gouvernement de pays ayant en 
commun I'usagi Z'l fran^ais, sous le thime : Industries de la langue, Quebec, 5 septembre 1987. 

^^JGBD = Syitime de gestion de bases de donndes. 
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tiis communs 4 Tensemble de Torganisation. Pour sa part Teneabaum, en se referant aux barrieres 
actuelles de complexity des systemes expert?, parle du besoin de se donner des outils de develop- 
pement plus puissants, en particulier des outils specialises oour certains domaines d'application avec 
des banques de connaissances specialisees et d*autres banques plus generales. Pour ces dernieres, il 
mentionne Timportance des concepts et des relations de temps, d'espace, de causality comme outils 
utilisables de fagon profitable d^ms le d^veloppement d*Hpplications. 



1*1 Place du module Unguis tique 

La figure 2 presente la place eventuelle d'un module linguistique dans les systemes informatises 
de la fin du sidcle. Le sch6ma compte trois grandes boites interreliees et interdependantes : le 
module linguistique et le module d'inference sont encore inexistants, sauf i Tetat experimental dans 
quelqucs grandes organisations comme Bolt, Berart^'t & Newman, S<jeing et quelques autres. 

Ainsi, Tensemble des systemes existants se retrouve dans la bc**e SGBD, dans Tesprit de ce qui 
existe pour des systdmes multi-programmes, multi-usagers, de grand volume et avec des mecanismes de 
contrdle pour la security, la mise en reseau, etc. 



nCURE 2 



Place du module linguistique 





LANGAGB 




PBNS££ 


UODXJLE LINGmSTIQUE 

■ traittUMnt d« \h langut natu- 

a an&lyM de< otructures Unguia- 
tiqu«8 : lexiquct, tyntaxt et 
ttoumtique. 

■ ftructtim d'mtcrpnitation. 

■ an&lyMun gramroaticaux et 
dictionnaira. 




MODULE D'INFfiRENCE 

8 ty8tiin«s «xp«rt8. 

■ repxisentation des connatuan- 
ces : structures conceptuelles, 
cognitive*, de raisonnement. 

a grammaires cognitives, moteur 
d'inf^rence et bases de con- 
naissances. 




SYMBOLS 






CONCEPT 



\ / 

OBJET DU 

^ 1 dmi 

SGBD : syat&me de gestion de 
basei^ de donn^es. 

■ hases '*.e donn^es numiriqucs 
e. t^tuelles. 

a dictionnaires des donn6es. 

u progranunes sur mesure, 

■ progidels de traitement de 
communication, etc. 

RfiFfiRENT 

i n: 




UN MODULE LINGUISTiqUE POUR ^INFORMATIQUE, 



Le module linguistique decrit les structures et les mat6riaux que la langue frangaise (y compris 
les anglicismes) fournit 4 nos processus mentaux : lexique, syntaxe et s6mantique sont combines pour 
representer Tinformation (donnees) dans le SG3D, ainsi que Tinformation (connaissances) dans le 
module d'inference. La mise en correspondance des mc^.sles se fait grace t un langage formel 
commun (maintenu invisible aux usagers grdce 4 1'interface pour un dialogue ecrit en un frangais 
qui devra toujours subir certaines contraintes). 



1.2 Composantes du module Unguistique 

Essayons maintenant de decrire un peu plus pr^cisement ce que pourrait contenir un module 
linguistique. Trois types de composantes sont plausibles : 

1- Un analyseur grammatical du frangais contenant des informations sur le lexique, la morphologie 
et la syntaxe (sorte de «moteur Iinguistique», par analogie au moteur d'inference des systfemes 
experts)* 

2- Des dictionnaires de la langue frangaise comprenant les informations et les connaissances lexi- 
cales mentionnees plus haut, mais aussi des informations, des connaissances et des structures 
d' interpretation s^mantique. II y aura au moins deux types de dictionnaires du frangais : 

a) le dictionnaire de langue generale (ex. : Le Robert) avec des definitions, des classifications 
et des hierarchies conceptuclles, se prStant 4 divers usages (semantique, synonymic, asso- 
ciations, variations regionales); 

b) le dictionnaire de langue sp^cialisie : terminologies scientif iques et techniques, langues de 
speciaiite, vocabulaires de domalnes (ex. administratif). 

Ces divers dicLonnaires auront uu double usage : certaines suites de symboles sont 
destinies k 6tre lues par I'ordinateur et^d'autres sont destinies 4 I'affichage pour dtre lues 
par Putilisateur. 

3- Des outils de programmation pour la prise en compte du langage (administratif et autre) propre a 
une organisaUon. Cette composante sera ajout^e au module linguistique pour inclure le vo- 
cabulaire du domaine d'activit6 ce Torganisation, les structures conceptuelles, les regies de 
fonctionnement, les normes administratives, les iiens s^mantiques avec Jes bases de donnees, etc. 



13 Applications liees au module linguistique 

Dans «Potentiel d'application de Deredec dans le contexte c'e la bureautique», Pierre Plante 
(1986) avait aivis6 les appUcations en deux grandes categories, soit les situations d'ecriture et 
les situations de lecture. La liste qui suit provient en grande partie de cette etude, mais 
quelques elements ont ete ajoutes, particulierement en ce qui concerne les liens les olus directs a^ec 
les systemes-experts. 

A noter que la disti^^ction entre lecture et ecriture n'est p?3 iOujours evidente. Quand on ecrit, 
on se lit et se relit forc^ment, mais I'ecriture est considered ;omme dominante. II faut voir la 
distinction comme etant relative, puisqu'll y a presque toujours ur melange des deux types d'activite 
dans k ^ situations reelles. 

Voici done une liste representative, mais non-exhaustive, d'applications potentielles du module 
Q "nguistique 4 Tinformatisation du travail He bureau. L'aide apportee 4 I'usager porterait sur . 
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1- Vicriture : 

- correction orthographique et grammaticale; 

- verification de termes (uniformisation); 

- recherche d'aoalogies (ex. le Petit Robert est un dictionnaire analogique; 

- preparation de resumes; 

- etablissement d*un thesaurus (repertoire alphabetique des termes normalises); 

- indexation de documents; 

- mesures de lisibilite, de redondance lexicale et remarques sur le style; 

- verification de coherence de certaines structures semantiques; 

- redaction d'un document «norme» (rapport, contrat, memoire, compte-rendu); 

- «completion» d'un formulaire «intelligent» (capable de s'adapter gr^ce aux re'ponses 
anterieures de Tusager avec I'aide du module d'inference); 

- interfaces pour I'interrogation des bases de donnees de I'organisation et i I'exterieur, 
pour I'usage de progiciels statistiques et autres, pour certains systemes de transaction 
dans ies bureaux, pour les services t61ematiques grand public; 

- editeu; pour la modelisation et la programmation de systemes d'information et de syste- 
mes experts au moyen de grammaires cognitives, d'ensembles terminologiques, de regie- 
ments et normes maison, d*outiIs pouvant 6tre relies au SGBD, etc. 



2- la lecture : 

- reperage dans les bases de donnees numeriques et textuelles i partir d'elements lexicaux 
ou de contraintes syntaxiqucs ou semantiques; 

- exploration et analyse de contenu d'un corpus donne de textes en vue, par exemple, d'en 
faire une synthese, ou de les comparer entre eux, ou de relever les principaux propos 
sur divers themes et de les analyser; 

- classification documentaire selon un thesaurus pre-etabli ou selon des criteres lexico- 
semantiques mesures i oartir des textes mSmes. 



2.0 Exemple de radministration publique qu^b^coise 

La vision prospective des applications peut dtre prise comme une serie d'objvCtifs a long terme 
en vue d*accroUre la productivity dans I'adTiinistration publique. C'est ce qui inspire I.',s actions du 
Bureau central d*informatique, en raison de son rdle de coordination dans le secteur public, qui est de 
favoriser I'apprentissage de nouvelles methodes et I'application de nouvelles techniques derivees des 
recherches en intelligence artificielle. L'attention a surtout porte sur les systemes experts, mais les 
applications linguistiques font I'objet de travaux importants sur le point d'etre amorces. Dans les 
deux cas, les objectifs ront les mSmes : 

- identifier les types et les zones d'application les plus prometteuses; 

- contribuer i la conception de modeles et i la mise au point d'outils pour adapter ailleurs ces 
premiers modeles; 

- viser k faciliter la combinaison entre des outils logiciels pour Tanalyse linguistique et oeux 
pour la representation des connaissances, et i I'interaction requise avec les systemes infor- 
matiques existants. 

La concretisation de ces objectifs se fait par Tintermediaire de projets-pilotes ou Ton tente de 
realiser des modeles generaux sous forme de progiciels repondant a des besoins specif iques, mais 
combinables grSce i un systeme formel commun (Deredec). C'est ainsi qu'a ete mis au point un 
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Progiciel de Generation de Systeme Expert (PGSE) qui fait I'objet d'un perfectionnement continu, 
principalement par contrat avec des chercheurs universitaires. L'interfit de cet outil est de prefigurer 
le module d^inference appele k interagir etroitement avec le module linguistique. 

Les projets relevant du module linguistique sont dej^ importants : 

- un progiciel de correction orthographique et grammaticale, utilisable en mode interactif, et 
congu pour des elfeves de 6* annee (ministere vie I'Education); 

- un systeme d'aide au depouillement terminologique (Office de la langue frangaise); 

- groupe d*etude interminist6riel dont les participants identifient un corpus de textes 
significatifs pour leur organisation en vue d*en mieux connaitre le lexique et d'evaluer les 
possibilites d'applicatiou de modeles d'enrichissement semantique par rapport au vocabulaire 
de leur domaine et h leur contexte en termes de systeme d'information. Le titre de ce projet 
juxtapose deux phases . «Projet lexical et semantique de domaines». Trois choix important 
ont guid6 la conception du projet : le niveau de langage, les domaines d'application, les 
logiciels utilises. 



2 J Choix du niveau de langage 

Le choix des «zones» de langage ^ etudier en vue de les representer en priorite dans I'admi- 
nistration publique releve dans un premier t'^smps des niveaux de contenu. Ce n'est pas dans Tadmi- 
nistration publique que doit dtre effectue le travail sur le vocabulaire de base et general du fran9ais. 
L'evaluation doit porter sur des domaines bien circonscrits, i partir de criteres semblables ^ ceux 
qu'on utilise pour juger de la faisabilite d*un systeme expert. 

U est evident qu^on peut se perdre dans Timmensite du langage si on cherche a tout couvrir. 
Comme pour les systemes-experts^ on doit se limiter k des vocabulaircs restreints (quelques centaines 
ou quelques milliers de mots) dont la representation automatisee en dictionnaire evolutif permet 
d*envisager des applications rentables. Une approche etapiste ainsi que des resultsits «intermediaires» 
utilisables constituent des moyens pour explorer concretement des hypotheses sur le module linguis- 
tique: >>n pourra alors s'interesser notamment k la taille des vocabulaires, ^ Timportance du chevau* 
chemeat des domainf^s, aux aspects cognitifs des structures se: antiques d'un domaine, etc. 



2.2 Choix des domaines d'application 

Le choix des domaines d'application qui suit a ete fait progressivement au cour:> des derniers 
mois gr&ce k des echanges avec des professionnels de la fonction publique iateresses aux systemes 
experts* Le resultat provLsoire de ce processus de consultation a permis d'identifier six domaines 
d'application qui apparaissent interessants pour differentes raisons. 



1 - L'Jnformatiqi*e : analyser des dictionnalrer. de donnees des SGBD relationnels existant dans la 
fonction publique et d'autres modeles oe donnees en vue d'aider & la mcdelisation et a 
Tadministration conceptuelle des donnees. 

2- La gestion documentaire : analyser les plans de classification d'organismes du secteur public 
et du ministere en vue d'aider a la classification et au reperage des documep .b, 

?- Les normes administratives : analyser les reglements, les normes, les procedures et formu- 
laires dans un secteur interessant le Conseil du Tresor. 
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4- Le calcul et Tanalyse statistique : analyser la terminologie du domaine de la statistique et 
des elements de dop^ees dans deux ministdres, en vue de favoriser Tacces aux outils statis- 
tiques ainsi qu*aux donnees emmagasinees dans leurs banque de donnees. 

5- Uenvironnement : analyser le vocabulaire administratif et reglementaire de Tenvironnement 
en usage dans ce ministdre (rdglements, orientations, politiques) ainsi que le vocabuJaire 
relatif h Tadministration d*un programme hautement scientif ique (Systeme d*aide k la gestiou 
des evaluations environnementales. 

6- Les municipalites : analyser le vocabulaire des SystSmes dMnformation urbains k references 
spatiales ou celui d*un guide d*information sur les municipalites prepare recemment. 



Pour les trois premiers domaines, (informatique, gestion documentaire et normes administra- 
tivesX on peut viser le developpement d^outils horizontaux qui seraient adaptes localement tout en 
conservant une coherence d*ensemble : ce sont d*importants champs d'application pour Tadminis- 
tration publique. 

Le quatrieme domaine (calcuI et analyse statistique) est en partie une affaire de langage d'une 
specialite scientif ique, mais il constitue aussi un acces aux bases de donnees d'une organisation en des 
termes i*amiliers pour «quelqu*un du domaine». 

Les deux derniers domaines (environnement et municipalites) constituent des secteurs d'activites 
determines de I'administration publique; ils ont ete choisis parce qu'ils presentaient des possibilites 
d'^ipplication int6ressantes en bureautique et en tilematique. lis sont toutefois differents : avec 
renvironnemeniL, Taccent est mis sur une terminologie scientifique et sur la bureautique (systemes 
experts) alors qu^avec les municipalites, Taccent est semblable pour les S.LU.R.S., mais la terminologie 
est plus vulgarisante dans le guide dMnformation. 

DiffSrents principes ont done inspire le chojx des domaines d*appIication. Le tout constitue un 
premier echantillon exploratoire de la langue de ^administration publique. 



2J Choix des logiciels utilises 

p^redec est choisi en tant qu'outil formel, en tant que systeme existant de description liii- 
guistique du frangais et parce quMl est compatible avec les structures de representation requises par 
les systfemes experts. Cela n*exclut abso^iiment pas sa combinaison eventuelle avec d'autres produits 
existants. Le choix de D^redec comme outil principal de support se comprend facilement eu egard 
au developpement en cours de D6redec- EXPERT, ainsi que des projets qui seront bientdt entrepris sur 
PEcritoire (avec le ministere de TEducation) et sur un syst6me d'aide au depouillement termino- 
logique (avec TOffice de la langue frangaise). 



Conclusion 

Ce qu*il faut comprendre pour croire k cette demarche, c*est que la langue frangaise est en train 
de devenir un objet dMnformation. II faut pr^voir une croissance rapide du marche au cours des 
annees 1990 et ne pas investir Ik ou des efforts dans des domaines ou sur des aspects trop universels 
seraient inutiles compte tenu de produits commerciaux existants. Une organisation doit plutdt investir 
dans r^tude de ses particularites, de fagon k devenir complementaire aux produits qui existent dej^ ou 
qui sont susceptibles d*apparaitre sur le marchd : c*est Tesprit du << pro jet lexical et semantique de 
domaines». Cette demarche permettra en mfime temps de commencer k explorer les contraintes et les 
capacites d*un eventuel «mocIule Iinguistique» en interaction avec un «moduIe d'inference» et les 
SGBD accessible^ sur reseau ou localement. 
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